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内 容 简 介 


本 书面 向 金融 应 用 ， 系 统 地 阐述 了 大 数据 金融 与 征 信 本 身 及 其 在 现实 生活 中 的 应 用 ， 具 有 全 面 性 、 
实用 性 和 前 瞻 性 等 特色 。 全 书 共 8 章 ， 第 1 章 和 第 2 章 阐述 大 数据 金融 及 大 数据 技术 相关 的 基础 知识 问 
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中 的 应 用 ， 是 本 书 的 主要 内 容 。 第 7 章 重 点 阐述 大 数据 在 征 信 中 的 实际 应 用 ， 是 本 书 的 另 一 重点 问题 ， 
也 是 当代 大 数据 研究 的 热点 问题 。 第 8 章 特别 强调 中 国 金融 信息 安全 ， 这 是 大 数据 金融 与 征 信 的 发 展 进 
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考 所 用 。 
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前 襄 


大 数据 金融 是 大 数据 在 金融 领域 的 重要 应 用 。 大 数据 金融 市 场 前 景 广阔 ， 预 计 未 来 5 
年 到 10 年 ， 金 融 大 数据 产业 将 迎 来 黄金 增长 期 ， 大 数据 也 将 成 为 助 推 “大 众 创业 、 万 众 
创新 ”浪潮 的 有 力 抓 手 。 

本 书 为 适应 高 等 学 校 互 联网 金融 专业 人 才 培 养 的 需要 ， 从 理论 联系 实际 的 原则 出 发 ， 
以 大 数据 的 实际 运用 为 导向 ， 对 大 数据 在 金融 各 行业 的 应 用 做 了 全 面 系统 的 介绍 。 

全 书 共 分 为 8 章 ， 包 括 大 数据 金融 概述 、 大 数据 相关 技术 、 大 数据 在 商业 银行 中 的 应 
用 、 大 数据 在 证 券 行业 中 的 应 用 、 大 数据 在 保险 行业 中 的 应 用 、 大 数据 在 互联 网 金融 中 的 
应 用 、 大 数据 征 信 、 大 数据 与 中 国 金融 信息 安全 。 

由 于 大 数据 金融 刚刚 兴起 ， 可 供 参 考 的 资料 不 多 ， 本 书 也 仅仅 是 在 这 方面 的 一 个 探 
索 ， 故 全 书 整体 框架 以 编者 自己 的 思路 进行 呈现 。 本 书 以 应 用 特别 是 金融 领域 前 沿 的 应 用 
为 导向 ， 以 在 各 行业 的 实践 为 主线 展开 。 本 书 内 容 新 颖 全 面 ， 论 述 问 题 极 具 现 实意 义 。 本 
书 可 以 作为 高 等 院 校 互 联网 金融 专业 相关 课程 的 教材 ， 也 可 供 互联 网 金融 研究 者 、 从 业 
者 、 管 理 人 员 参 考 。 

全 书 主要 有 以 下 两 大 特点 。 

(1) 内 容 全 面 。 

本 书 以 大 数据 为 出 发 点 ， 结 合 国内 外 的 发 展现 状 及 最 新 模式 ， 系 统 地 介绍 了 大 数据 在 
银行 业 、 证 券 业 、 保 险 业 、 互 联网 金融 行业 及 征 信 中 的 应 用 ， 并 强调 了 在 应 用 过 程 中 ， 中 
国 金融 信息 安全 的 重要 性 及 保障 机 制 。 本 书 内 容 涵 盖 面 极 广 ， 有 效 地 为 各 行 各 业 的 读者 提 
供 了 大 数据 金融 与 征 信 的 宏观 视图 。 

(2) 体例 新 颖 。 

本 书 秉承 着 注重 实际 运用 的 宗旨 ， 编 写 体例 上 彰显 了 可 读 性 和 互动 性 。 每 章 前 有 “本 
章 目标 ”和 “本 章 简介 ”， 每 章 末 有 “本 章 总 结 ” 和 “本 章 作业 ”。 书 中 除了 理论 教学 ， 
还 配 有 相关 案例 和 解析 ， 使 理论 与 实践 相 结合 ， 通 俗 易 懂 ， 开 拓 了 学 生 的 视野 ， 可 以 更 好 
地 满足 培养 既 懂 专业 知识 又 能 运用 所 学 知识 解决 实际 问题 的 “复合 型 ”经 济 人 才 需 求 。 

本 书 由 新 迈 尔 (北京 ) 特 技 有 限 公 司 组 织 研发 ， 由 何平 平 拟定 大 纲 并 进行 统 稿 ， 湖 南大 
学 互联 网 金融 研究 所 组 织 撰写 。 本 书 由 何平 平 、 车 云 月 担任 主编 ， 以 下 研究 生 也 参与 了 本 
书 的 编写 : 王 杨 毅 彬 、 周 春 亚 、 张 童 、 刘 诗 雨 、 刘 晶 宇 。 

本 书 编写 过 程 中 参考 了 大 量 的 文献 资料 ， 有 些 已 经 在 书后 的 参考 文献 中 标注 ， 而 有 些 
没有 ， 在 此 一 并 表示 感谢 。 园 于 时 间 和 个 人 能 力 ， 书 中 难免 有 朴 漏 和 不 妥 之 处 ， 敬 请 读者 
批评 指正 。 


何平 平 


《互联 网 金融 系列 丛书 》 编 审 委员 会 


主 任 : 
湖南 大 学 互联 网 金融 研究 所 主 任 和 何 于 平 
副 主任 : 
新 迈 尔 (北京 ) 科技 有 限 公 司 总 经 理 车 云 月 
河北 工业 职业 技术 学 院 工商 管理 系 主 任 韩 彦 国 
河北 工业 职业 技术 学 院 工商 管理 系 副 主任 马 明 
主任 委员 : 
湖南 大 学 互联 网 金融 研究 所 王 杨 毅 彬 
湖南 大 学 互联 网 金融 研究 所 周 春 亚 
湖南 大 学 互联 网 金融 研究 所 刘 诗 雨 
湖南 大 学 互联 网 金融 研究 所 张 童 


湖南 大 学 互联 网 金融 研究 所 刘 晶 宇 


大 数据 金融 概述 1 
大 数据 概述 2 
1.1.1 大 数据 的 内 涵 与 特征 … 2 
1.1.2 大 数据 的 分 类 
1.1.3 大 数据 的 价值 8 


1.2.2 通信 .… a 

L230 医疗 “3 
2 16 
大 数据 金融 的 内 涵 、 特 点 与 优势 .……18 
1.3.1 大 数据 金融 的 内 涵 … .18 


1.3.2 ”大 数据 金融 的 特点 … 
1.3.3 ”大 数据 金融 相对 于 传统 


1.4.1 
1.4.2 
1.4.3 


大 数据 带 来 银行 业 大 变革 
大 数据 带 来 保险 业 大 变革 
大 数据 带 来 证 券 业 大 变革 .….…. 
1.4.4 ”大 数据 带 来 征 信行 业 大 变革 .…25 
1.4.5 互联 网 金融 中 的 大 数据 应 用 …26 
大 数据 金融 模式 … :2 
1.5.1 平台 金融 模式 . 
1.5.2 ”供应 链 金 融 模式 . 
大 数据 金融 信息 安全 . 
大 数据 应 用 案例 本 
1.7.1 案例 之 一 : 滴 滴 出 行 ………… 30 
1.7.2 ”案例 之 二 大 数据 与 美 团 

外 卖 的 精细 化 运营 … 


2.1.1 
21.2 
2.13 
2.1.4 
之 1.5 


2.2.2 外围 数据 . 

2.2.3 ”常规 渠道 数据 .. 
2.3 大 数据 架构 

2.3.1 HDFS 系统 .… 

2.3.2 MapReduce... 

2.3.3 HBase . 
2.4 数据 挖掘 方法 .63 

2.4.1 分 类 分 析 . .64 

2.4.2 ”回归 分 析 . 685 

2.4.3 ”其 他 方法 . .66 
本 章 总 结 .… .69 
本 章 作 业 :0 


第 3 章 大 数据 在 商业 银行 中 的 应 用 .. 
3.1 客户 关系 管理 


EF 
3.1.2 
3 和 .3 
3.1.4 


3.2 


3.2.4 


客户 细 分 . 
预见 客户 流失 .… 
高 效 渠道 管理 .. 
推出 增值 服务 ， 提 升 客户 


案例 一 一 大 数据 帮助 商业 银行 
改善 与 客户 的 关系 


社交 化 营销 .… 


目录 


33 


325， 个 性 化 推荐 .ee 81 
3.3.1 ”贷款 风险 评估 有 
3.32 ”信用卡 自动 授信 .pp 84 
3.3.3 ”案例 一 一 大 数据 为 商业 银行 


信贷 管理 提供 更 多 可 能 


5 


4.1 


4.2 


大 数据 风险 控制 与 传统 风险 
控制 的 区 别 .. 


3.4.1 


3.4.2 ”基于 大 数据 的 银行 风险 管理 


产品 和 服务 优化 103 
3.5.3 网络 与 情 分 析 .4 104 
3.5.4 ”案例 一 一 大 数据 分 析 助 力 

手机 银行 优化 创新 


大 数据 在 股票 分 析 中 的 应 用 
4.1.1 基于 基本 面 分 析 的 数据 挖掘 


4.1.2 


4.1.3 决策 树 法 的 应 用 
4.1.4 ” 聚 类 分 析 法 的 应 用 
4.1.5 ”人 工 神 经 网 络 算法 的 应 用 .…… 

Eo 119 
4.2.1 客户 细 分 
4.2.2 ”客户 满意 度 .. 


4.2.3 流失 客户 预测 … 


43 


4.4 


7 127 
4.3.1 投资 者 情绪 的 测量 …………… 127 
4.3.2 ”基于 网 络 与 情 的 投资 者 情绪 


大 数据 与 量化 投资 


4.4.1 量化 投资 概述 134 
4.4.2 ”证券 量 化 投资 中 的 主要 分 析 
Re 135 
4.4.3 大 数据 在 证 券 量 化 投资 中 的 
应 用 .136 
本 章 总 结 
本 章 作业 .… 
第 5 章 大 数据 在 保险 业 中 的 应 用 .……… 141 
1 天 数据 保险 142 
5.1.1 大 数据 保险 的 概念 和 特征 .…. 142 
5.1.2 ”保险 业 大 数据 应 用 的 阶段 …. 143 
5.1.3 ”大 数据 在 保险 行业 中 的 


$2 


5.3 


大 数据 对 承保 定价 的 革新 .….. 151 
大 数据 在 车 险 定价 中 的 


大 数据 在 健康 险 定价 中 的 
应 用 


5.3.1 保险 精准 营销 

5.3.2 ”大 数据 与 保险 精准 营销 

5.3.3 ”组建 垂 直 平 台 生 态 圈 ………… 167 

5.3.4 大 数据 精准 营销 在 保险 业 中 的 
风 几 www 169 


5 水 村 放 讽 出 
5.4.1 
5.4.2 ”大 数据 与 保险 反 欺诈 
5.4.3 ”大 数据 与 车 险 反 欺诈 .……………… 176 
5.4.4 大 数据 与 健康 险 的 理赔 
风险 . 
本 章 总 结 ……- 
二 关 ( 权 外 
第 6 章 互联 网 金融 中 的 大 数据 应 用 .….185 
6.1 基于 大 数据 的 第 三 方 支付 欺诈 
风险 管理 .86 
6.1.1 第 三 方 支付 中 的 欺诈 风险 .…..186 
6.1.2 大 数据 应 用 与 欺诈 
网 隐 卫生 
6.2 大 数据 在 网 络 借贷 中 的 应 用 
6.2.1 推荐 系统 简 述 
6.2.2 P2P 网 站 中 的 个 性 化 推荐 .…..190 
6.2.3 基于 VITA 系统 的 信贷 产品 
匹配 机 制 .2 191 
6.3 ”大 数据 在 互联 网 供应 链 金 融 中 的 
na 
6.3.1 基于 大 数据 的 互联 网 企业 
和 信 站 沁 信 ss 194 
6.3.2 ”案例 : 京东 供应 链 金 融 
模式 | 
6.4 大 数据 在 互联 网 消费 金融 中 的 
本 网 198 
6.4.1 互联 网 消费 金融 的 大 数据 
征 信和 与 风 控 .sseasaneaaaasas 198 


6.4.2 ”案例 : 芝麻 信用 


72 


7.1.1 
7.1.2 


证 售 横 过 < 
征 信 的 基本 流程 
7.1.3 人 征 信 行业 产业 链 
7.1.4 征 信 产 品 … 
7.1.5 征 信 机 构 … 
7.1.6 征 信 体 系 
大 数据 征 信 … 二 
7.2.1 大 数据 征 信 概 述 .pe 2 
7.2.2 ”大 数据 征 信 的 理论 基础 
7.2.3 大 数据 征 信 流 程 . 


7.3 大 数据 征 信 和 典型 企业 233 
7.3.1 国外 大 数据 征 信 和 典型 企业 .…:233 
7.3.2 ”国内 大 数据 征 信和 典型 企业 .….242 

本 章 和 上 缚 Rs 249 

让 250 

第 8 章 大 数据 与 中 国 金 融 信息 安 全 .…..251 

8.1 金融 信息 安全 的 重要 性 
8.1.1 金融 信息 安全 的 含义 
8.1.2 ”金融 信息 安全 的 属性 特征 .…. 
8.1.3 ”金融 信息 安全 的 重要 性 ……… 

8.2 ”大 数据 给 我 国 金融 信息 安全 带 来 的 
机 遇 和 挑战 … 

8.2.1 大 数据 给 金融 信息 安全 

带 来 的 机 遇 ..256 
8.2.2 ”大 数据 给 我 国 金融 

安全 带 来 的 挑战 . ..257 
8.2.3 案例: 美国 “棱镜 门 ” 

8.3 ”大 数据 金融 信息 安全 风险 . 

8.3.1 大 数据 金融 信息 安全 风险 的 
TR 263 

息 安 全 风险 的 
人 266 

8.3.3 ”国内 外 金融 信息 安全 事件 及 
Re 268 


VI 


目录 


8.4 


8.5 


8.6 


我 国 金融 信息 安全 现状 及 
山药 因 闲 Rss 


8.4.2 ”我国 金 融 信息 安全 的 
美国 金融 信息 安全 保障 机 制 275 


8.5.1 美国 金融 信息 安全 保障 
机 制 的 特点 .cc 275 
8.5.2 ”美国 金融 信息 安全 保障 
机 制 的 主要 做 法 … 
我 国 金融 信息 安全 建设 … 
8.6.1 完善 顶层 设计 ， 尽 快 构建 适应 
我 国 金融 发 展 需要 的 金融 信息 


8.6.2 ”尽快 制定 我 国 金融 行业 国产 


信息 技术 产品 和 服务 替代 
8.6.3 ”尽快 制定 金融 行业 自主 可 控 
战略 实施 步骤 ， 推 进 自主 可 
控 国 家 战略 278 
应 用 大 数据 进行 信息 安全 
分 析 .… 


大 数据 金融 概述 


@ ”掌握 大 数据 的 内 涵 与 特征 @@ 了 解 大 数据 给 金融 业 带 来 的 大 
@ 了 和 解 大 数据 产生 的 背景 变革 
@ 掌握 大 数据 的 类 别 @@ 了 解 大 数据 给 征 信 业 带 来 的 大 
@ ”了解 大 数据 的 价值 和 应 用 领域 变革 
@ ”掌握 大 数据 金融 的 内 涵 特点 @ 了 和 解 互联 网 大 数据 中 的 应 用 
@ 掌握 大 数据 金融 相对 于 传统 金 @ 掌握 大 数据 金融 的 两 种 模式 

融 的 优势 ee 了解 大 数据 金融 信息 安全 


随 着 计算 机 技术 和 互联 网 的 发 展 ， 大 量 的 音频 、 图 片 、 视 频 等 结构 化 数据 和 半 
结构 化 数据 不 断 涌现 ， 传 统 的 数据 处 理 技术 已 经 难以 应 对 ， 因 此 大 数据 的 概念 应 运 
而 生 。 随 着 大 数据 技术 的 成 就 ， 大 数据 已 经 广泛 应 用 于 商业 、 通 信 、 医 疗 、 金 融 等 
领域 ， 给 各 行 各 业 带 来 了 巨大 的 价值 。 

近 几 年 ， 大 数据 浪潮 迅速 席卷 全 球 ， 数 据 成 为 企业 重要 的 生产 要 素 和 战略 资 
产 ， 拥 有 大 数据 资产 的 企业 将 在 竞争 中 占有 优势 。 金 融 业 本 身 就 是 基于 数据 与 信息 
的 产业 ， 作 为 现代 经 济 的 核心 ， 敏 锐 的 金融 行业 正在 积极 拥抱 大 数据 技术 。 大 数据 
金融 相对 于 传统 金融 有 着 无 可 比拟 的 优势 ， 引 起 了 金融 行业 广泛 而 深远 的 变革 ， 包 
括 银 行业 、 保 险 业 、 证 券 业 、 征 信 业 及 互联 网 金融 。 

本 章 重 点 讲解 大 数据 的 内 涵 与 特征 、 大 数据 的 分 类 、 大 数据 的 处 理 流程 以 及 大 
数据 的 价值 和 应 用 领域 、 大 数据 金融 的 内 涵 特点 、 大 数据 金融 相对 于 传统 金融 的 优 
势 、 大 数据 带 来 金融 业 和 征 信 业 大 变革 、 互 联网 大 数据 的 应 用 和 大 数据 金融 的 两 种 
模式 : 


@ 
全 
1 
简 
2 


~ 


人 xuaneusit 
(OD 大 数据 概述 


在 互联 网 中 ， 大 数据 无 处 不 在 。 无 论 是 漫 无 目的 的 浏览 网 页 、 观 看 视频 ， 还 是 发 微 
博 、 聊 微 信 ， 以 及 有 目的 性 的 搜索 ， 基 于 每 个 用 户 都 会 产生 数据 ， 这 些 分 散 的 数据 汇集 到 
网 络 中 形成 数据 流 ， 并 最 终 聚 集 到 网 络 服务 提供 商 ， 形 成 大 数据 。 


1.1.1 大 数据 的 内 涵 与 特征 
1. 大 数据 与 小 数据 


大 数据 (big data) 是 指 在 一 定时 间 范 围 内 无 法 用 传统 数据 库 软 件 进行 采集 、 存 储 、 管 理 
和 分 析 的 数据 集 或 数据 群 ， 需 要 通过 新 的 处 理 模式 才能 体现 出 的 具有 高 效率 、 高 价值 、 海 
量 、 多 样 化 特点 的 信息 资产 。 利 用 数据 挖掘 分 析 技 术 可 以 使 这 些 结构 化 、 半 结构 化 、 非 结 
构 化 的 海量 数据 产生 巨大 的 商业 价值 。 小 数据 (small data)， 或 称 个 体 资料 ， 是 以 个 体 为 中 
心 ， 需 要 新 的 应 用 方式 才能 体现 出 的 具有 高 价值 、 个 体 、 高 效率 、 个 性 化 特点 的 信息 资 
产 。 大 数据 和 小 数据 有 着 本 质 的 区 别 ， 虽 然 两 者 都 是 以 创造 数据 价值 为 目的 ， 但 是 在 收集 
目的 、 数 据 结构 、 生 命 周 期 、 分 析 方 法 及 分 析 重 点 5 个 方面 都 存在 着 不 同 的 定位 。 

1) ”收集 目的 

小 数据 的 目的 性 很 强 ， 往 往 是 为 了 一 个 目标 ， 制 定 规划 进行 收集 、 整 理 和 分 析 ， 不 会 
收集 与 其 研究 目的 无 关 的 数据 。 而 大 数据 收集 没有 明确 的 目标 ， 收 集 的 数据 范围 更 广 ， 在 
数据 采集 阶段 并 不 明确 知道 会 产生 什么 结果 。 

2) ”数据 结构 

小 数据 的 数据 基本 来 自 相同 的 行业 和 领域 ， 数 据 种 类 单一 ， 结 构 统 一 ， 并 采取 一 种 有 
序 排列 的 结构 化 方式 。 而 大 数据 的 数据 来 自 不 同 的 行业 和 领域 ， 数 据 种 类 复杂 ， 数 据 标准 
和 格式 有 所 不 同 ， 非 结构 化 的 数据 居多 ， 无 法 进行 统一 排序 。 

3) ”生命 周期 

小 数据 的 生命 周期 比较 短 ， 几 乎 只 有 几 年 的 时 间 ， 待 相关 问题 解决 或 相关 项 目 结束 之 
后 ， 小 数据 一 般 会 被 删除 。 而 大 数据 的 工作 主要 是 进行 预测 。 只 有 基于 完整 的 历史 数据 才 
能 对 未 来 进行 相对 准确 的 预测 。 因 此 ， 大 数据 的 生命 周期 相对 较 长 ， 大 部 分 会 被 永久 保留 。 

4) ”分 析 方 法 

小 数据 采用 一 般 的 统计 方法 对 收集 的 所 有 数据 进行 分 析 ; 而 大 数据 因 其 复杂 性 一 般 通 
过 分 布 式 的 方式 进行 分 析 ， 采 用 训练 、 学 习 、 聚 合 、 归 一 化 、 转 化 、 可 视 化 等 多 种 不 同 的 
方法 分 析 。 

5) 分析 重点 

小 数据 是 以 个 体 行为 数据 为 对 象 ， 主 要 是 对 个 体 数据 信息 进行 全 方位 的 精确 的 挖掘 分 
析 ， 重 点 在 于 深度 ; 而 大 数据 是 以 某 个 群体 行为 数据 为 对 象 ， 主 要 是 对 大 范围 大 规模 的 数 
据 处 理 分 析 ， 重 点 在 于 广度 。 

小 数据 不 涉及 大 量 的 、 急 速 的 数据 ， 或 是 繁多 的 信息 种 类 ， 也 没有 隐 含 与 大 数据 有 关 
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的 复杂 化 信息 ， 并 常 以 微观 角度 解释 小 型 对 象 。 而 大 数据 则 立 于 宏观 角度 ， 致 力 于 表述 宏 
观 现 象 。 简 言 之 ， 用 大 数据 得 到 规律 ， 用 小 数据 匹配 个 人 。 


2. 大 数据 的 内 涵 


大 数据 的 概念 较为 抽象 。 大 数据 中 的 “数据 ”是 指 广义 的 数据 ， 不 仅 包括 传统 的 结构 
化 数据 ( 即 可 以 用 二 维 表格 表述 的 数据 )， 还 包括 非 传统 的 非 结 构 化 数据 (如 视频 、 音 频 等 )， 
大 数据 中 的 “大 ” 既 形 容 数据 量 多 ， 也 形容 数据 产生 和 变化 的 速度 非常 快 。 大 数据 的 内 涵 
主要 体现 在 数据 类 型 、 技 术 方法 和 分 析 应 用 3 个 方面 。 

1) “数据 类 型 方面 

大 数据 不 仅 包括 传统 的 结构 化 和 半 结 构 化 的 交易 数据 ， 还 包括 巨 量 的 非 结 构 化 数据 和 
交互 数据 ， 它 是 包括 交易 和 交互 数据 集 在 内 的 所 有 数据 集 ， 如 社交 网 站 上 的 数据 、 在 线 
金融 交易 数据 、 公 司 记录 、 和 气象 监测 数据 、 卫 星 数据 和 其 他 监控 、 研 究 和 开发 数据 。 

2) ”技术 方法 方面 

核心 是 从 各 种 各 样 类 型 的 数据 中 快速 获取 有 价值 信息 的 技术 及 其 集成 ， 依 据 大 数据 的 
生命 周期 的 不 同 阶段 可 以 将 大 数据 处 理 技术 分 为 大 数据 存储 、 大 数据 挖掘 和 大 数据 分 析 3 
个 方面 。 大 数据 存储 包括 直接 外 挂 存储 (DAS)、 网 络 附加 存储 (NAS)、 存 储 域 网 络 (SAN) 等 
存储 方式 。 大 数据 挖掘 主要 采用 的 是 分 布 式 挖掘 和 云 计算 技术 。 

3) “分 析 应 用 方面 

重点 是 采用 大 数据 技术 对 特定 的 数据 集合 进行 分 析 ， 及 时 获得 有 价值 的 信息 。 常 用 数 
理 统 计 方法 进行 数据 分 析 ， 如 可 视 化 的 数据 分 析 工 具 。 在 数据 分 析 过 程 中 不 仅 需要 计算 机 
进行 自动 化 的 分 析 ， 还 需要 人 工 进行 数据 的 选择 和 参数 的 设 定 。 

3. 大 数据 的 特征 


大 数据 具有 5 个 特征 : 大 体 量 (Volume)、 多 样 性 (Variety)、 时 效 性 (Velocity)、 准 确 性 
(Veracity)、 价 值 性 (Value)， 如 图 1.1 所 示 。 


准确 性 
(Veracity) 人 


图 1.1 大 数据 的 特征 
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1) ”大体 量 

大 体 量 ， 即 数据 量 大 ， 是 大 数据 的 基本 属性 。 大 数据 一 般 是 指 10 TB(1 TB=1024 GB) 
规模 以 上 的 数据 量 ， 甚 至 可 从 数 百 TB 到 数 十 数 百 PB、EB 的 规模 。 资 料 显示 ， 百 度 首 页 
导航 每 天 需要 提供 的 数据 超过 1.5PB(1PB=1024TB)。 导 致 数据 规模 剧 增 的 原因 有 : @ 传 感 
器 等 各 种 仪器 获取 数据 的 能 力 大 幅 提高 ， 越 来 越 多 的 事物 特征 可 以 被 感知 ， 这 些 特 征 数据 
将 会 以 数据 的 形式 被 存储 下 来 。@@ 互 联网 的 普及 ， 使 数据 的 分 享 和 获取 越 来 越 容 易 ， 无 论 
是 用 户 有 意 还 是 无 意 的 分 享 或 浏览 网 页 都 会 产生 大 量 数据 。@ 集 成 电路 价格 的 降低 ， 使 很 
多 数据 被 保存 下 来 。 国 际 数据 资讯 GDC) 公 司 监测 ， 全 球 数据 量 大 约 每 两 年 翻 一 番 ， 预 计 到 
2020 年 ， 全 球 将 拥有 约 35ZB 的 数据 量 ( 见 图 1.2)， 并 且 85% 以 上 的 数据 以 非 结构 化 或 半 
结构 化 的 形式 存在 。 
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1.2 “IDC 全 球 数据 量 使 用 情况 及 预测 


2) 多样 性 

数据 类 型 多 样 化 是 大 数据 的 第 二 大 特点 。 大 数据 包括 各 种 格式 和 形态 的 数据 。 传 统 的 
数据 大 多 是 以 二 维 表 的 形式 存储 在 数据 库 中 的 文本 类 结构 化 数据 。 随 着 互联 网 的 发 展 和 传 
感 器 种 类 的 增多 ， 诸 如 网 页 、 图 片 、 音 频 、 视 频 、 微 博 类 的 未 加 工 的 半 结 构 化 和 非 结构 化 
数据 越 来 越 多 ， 以 数量 激增 、 类 型 繁多 的 非 结构 化 数据 为 主 。 非 结构 化 数据 相对 于 结构 化 
数据 而 言 更 加 复杂 ， 数 据 存储 和 处 理 的 难度 增 大 。 目 前 ， 我 国 商业 银行 业务 发 展 相 关 数 据 
类 型 已 从 结构 化 数据 扩展 到 非 结构 化 数据 。 

3) ”时 效 性 

大 数据 的 时 效 性 是 指 在 数据 量 特别 大 的 情况 下 ， 能 够 在 一 定 的 时 间 和 范围 内 得 到 及 时 
处 理 ， 这 是 大 数据 区 别 于 传统 数据 挖掘 最 显著 的 特征 。 大 数据 的 流动 速度 快 ， 当 处 理 的 数 
据 从 PB 增加 至 TB 时 ， 超 大 规模 的 数据 快速 变化 ， 使 用 传统 的 软件 工具 将 难以 处 理 。 只 
有 对 大 数据 做 到 实时 创建 、 实 时 存储 、 实 时 处 理 和 实时 分 析 ， 才 能 及 时 有 效 地 获得 高 价值 
的 信息 。 

4) “准确 性 

大 数据 的 准确 性 是 指 保证 处 理 的 结果 具有 一 定 的 准确 性 。 结 果 的 准确 性 涉及 数据 的 可 
信 度 、 偏 差 、 噪 声 、 异 常 等 质量 问题 ， 原 始 数据 的 输入 错误 、 缺 失 以 及 数据 预 处 理 系统 的 
失效 等 会 导致 数据 的 不 准确 ， 进 而 分 析 得 出 一 些 错误 的 结论 。 因 此 ， 保 证 正确 的 数据 格式 
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对 大 数据 分 析 十 分 重要 。 

5) ”价值 性 

大 数据 的 价值 性 是 指 大 数据 包含 很 多 深度 的 价值 ， 对 大 数据 的 分 析 挖 气 和 利用 将 产生 
巨大 的 商业 价值 。 数 据 量 呈 指数 增长 的 同时 ， 隐 藏 在 海量 数据 中 的 有 用 信息 却 没有 相应 比 
例 增长 ， 相 反 ， 价 值 密度 的 高 低 常 常 与 数据 总 量 的 大 小 成 反比 。 这 样 反 而 使 我 们 获取 有 用 
信息 的 难度 加 大 。 以 商业 银行 监控 视频 为 例 ， 连 续 数 小 时 的 监控 过 程 中 可 能 有 用 的 数据 仅 
有 几 秒 钟 。 

大 数据 的 特征 表明 大 数据 不 仅 数据 量 巨大 ， 种 类 繁多 ， 对 大 数据 的 分 析 将 更 加 复杂 ， 
更 加 追求 速度 ， 更 注重 时 效 性 、 准 确 性 以 及 价值 性 。 大 数据 不 仅 意味 着 数据 总 量 的 快速 增 
长 ， 其 更 大 的 意义 在 于 : 通过 对 大 容量 数据 的 交换 、 整 合 和 分 析 ， 及 时 识别 与 发 现 新 的 知 
识 ， 创 造 新 的 价值 ， 带 来 “大 知识 ”和 “大 发 展 ”。 作 为 一 种 重要 的 战略 资产 ， 大 数据 开 
启 了 一 次 全 新 的 、 重 大 的 时 代 转 型 。 


4. 大 数据 与 传统 数据 的 区 别 


大 数据 是 以 数量 巨大 、 类 型 众多 、 结 构 复杂 的 数据 集合 以 及 基于 云 计算 的 数据 处 理 和 
应 用 模式 ， 通 过 数据 的 集成 共享 、 交 叉 复 用 形成 的 智力 资源 和 知识 服务 。 大 数据 与 传统 数 
据 在 产生 方式 、 存 储 方式 、 使 用 方式 等 方面 都 有 所 不 同 。 

1) ”产生 方式 

传统 的 数据 是 根据 研究 目的 进行 采集 ， 采 集 的 数据 具有 重要 性 。 因 为 监管 要 求 、 业 务 
逻辑 或 者 技术 便利 ， 大 数据 具有 “ 自 产生 ”的 特点 ， 不 需要 特别 的 采集 过 程 ， 比 如 搜索 数 
据 、 交 易 数 据 等 ， 尽 管 有 些 数 据 可 能 没有 价值 。 

2) ”存储 方式 

大 数据 的 规模 远 远大 于 传统 数据 的 规模 。 相 对 于 传统 数据 库 ， 量 变 引 起 质变 ， 需 要 新 
的 数据 库 技术 来 支持 存储 和 访问 。 新 型 的 大 数据 存储 系统 除了 要 具备 高 性 能 、 高 安全 、 高 
宛 余 等 特征 之 外 ， 还 需 具 备 虚拟 化 、 模 块 化 、 弹 性 化 、 自 动 化 等 特征 ， 才 能 满足 具备 大 数 
据 特征 的 应 用 需求 。 

3) ”使 用 方式 

传统 数据 是 基于 样本 思维 进行 采集 的 ， 其 分 析 方 法 主要 是 基于 概率 论 理论 和 抽样 理 
论 。 通 常 是 通过 这 些 样 本 数据 推断 总 体 ， 很 难 从 这 些 数 据 中 提炼 出 超出 研究 设计 的 知识 。 
而 大 数据 则 是 基于 全 体 思维 ， 所 采集 的 数据 基本 能 够 代表 整体 ， 通 过 人 工 智能 、 神 经 网 络 
等 讲求 高 维和 高 效率 的 分 析 技 术 可 以 从 这 些 详尽 的 数据 中 得 出 有 价值 的 规律 和 知识 。 

5. 大 数据 的 产生 背景 : 计算 机 技术 与 互联 网 的 发 展 


随 着 计算 机 的 快速 发 展 和 互联 网 应 用 的 成 熟 ， 数 据 量 急剧 增加 ， 人 类 进入 大 数据 时 
代 。 数 据 的 采集 、 传 输 、 存 储 、 整 合 、 管 理 、 挖 掘 、 分 析 等 各 项 技术 快速 发 展 。 

1) “计算 机 技术 的 发 展 

1946 年 ， 第 一 台电 子 计算 机 的 诞生 开启 了 人 类 社会 信息 技术 革命 的 序幕 。 截 至 目前 ， 
计算 机 技术 的 发 展 经 历 了 大 型 主机 、 小 型 计算 机 、 微 型 计算 机 、 客 户 / 服务 器 、 互 联网 、 
云 计算 这 六 大 阶段 ( 见 图 1.3)。 
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1.3 ”计算 机 技术 经 历 的 几 个 阶段 


(1) 大 型 主机 阶段 (20 世纪 40 一 50 年 代 )。 此 阶段 的 计算 机 体型 十 分 庞大 ， 如 第 一 台 计 
算 机 由 18 800 个 电子 管 组 成 ， 重 量 约 27 吨 ， 占 地 约 150 平方 米 。 在 经 历 了 电子 管 数 字 计 
算 机 、 晶 体 管 数字 计算 机 、 集 成 电路 数字 计算 机 和 大 规模 集成 电路 数字 计算 机 等 发 展 历程 
后 ， 计 算 机 技术 逐渐 走向 成 熟 。 

(2) 小 型 计算 机 阶段 (20 世纪 60 一 70 年 代 )。 半 导体 和 集成 电路 的 改良 使 得 大 型 主机 经 

历 了 第 一 次 缩小 化 ， 使 用 成 本 也 因此 降低 ， 价 格 可 被 中 小 企业 接受 且 能 够 满足 中 小 企业 的 
信息 处 理 要 求 。 现 在 很 多 企业 使 用 的 服务 器 都 属于 小 型 计算 机 ， 在 体型 上 大 于 一 般 的 个 人 
计算 机 ， 小 于 大 型 主机 。 
(3) 微型 计算 机 阶段 (20 世纪 70 一 80 年 代 )。 这 个 阶段 是 对 小 型 计算 机 的 缩小 化 ， 计 算 
机 已 经 缩小 到 可 以 放置 在 桌面 上 ， 因 此 被 称 为 “微型 计算 机 ”或 者 “个 人 计算 机 ”。1977 
年 美国 苹果 公司 推出 了 Apple 二 代 计算 机 ， 大 获 成 功 。1981 年 IBM 推出 了 IBM - PC, 经 
过 不 断 的 改良 ， 功 能 不 断 加 强 ， 并 占领 了 个 人 计算 机 市 场 ， 由 此 个 人 计算 机 得 到 了 很 大 的 
普及 。 

(4) 客户 机 /服务 器 阶段 。 计 算 机 的 客户 机 /服务 器 结构 起 源 于 20 世纪 60 年 代 ，IBM 
与 美国 公司 建立 了 第 一 个 全 球 联机 订 票 系统 ，2000 多 个 订 票 终端 被 连 在 一 起 。 在 客户 机 / 
服务 器 结构 中 ， 网 络 的 基础 是 客户 机 ， 核 心 是 服务 器 ， 客 户 机 通过 服务 器 获得 所 需要 的 网 
络 资源 ， 其 优点 是 能 够 充分 发 挥 客户 端的 处 理 能 力 ， 减 轻 服务 器 的 压力 。 

(5) 互联 网 阶段 。1969 年 ， 美 国 国防 部 研究 计划 署 制定 的 协定 将 美国 加 利 福 尼 亚 大 学 
洛杉矶 分 校 、 斯 坦 福 大 学 研究 学 院 、 加 利 福 尼 亚 大 学 和 犹他 州 大 学 的 4 台 主 要 的 计算 机 连 
接 起 来 ， 标 志 着 计算 机 进入 因特网 阶段 ， 即 互联 网 阶段 。 此 后 ， 互 联网 经 历 了 文本 、 图 
片 、 语 音 、 视 频 阶段 ， 带 宽 不 断 变 快 ， 功 能 越 来 越 强 大 ， 这 是 人 类 迈 向 地 球 村 坚实 的 
一 步 


(6) 云 计算 阶 段 。2008 年 ，“ 云 计算 ”这 个 技术 名 词 开始 流行 起 来 ， 它 是 一 种 基于 互 
联网 的 计算 方式 ， 共 享 的 软 硬 件 资源 和 信息 可 以 按照 需求 提供 给 计算 机 和 其 他 设备 。 云 计 
算 阶段 ， 计 算 机 能 力 可 以 作为 一 种 商品 通过 互联 网 进行 流通 。 企 业 和 个 人 不 再 需要 购买 晶 
贵 的 硬件 ， 只 需 通过 互联 网 来 购买 或 者 租赁 计算 能 力 ， 为 所 使 用 的 计算 功能 付款 。 云 计算 
襄 括 了 开发 、 架 构 、 负 载 平 衡 和 商业 模式 等 ， 是 未 来 的 软件 业 模式 。 

2) ”互联 网 的 发 展 

互联 网 不 仅 改 变 了 传统 的 信息 传播 方式 ， 也 改变 了 人 们 的 生活 习惯 。 获 取信 息 变 得 更 
加 容易 ， 足 不 出 户 便 可 了 解 世界 新 闻 ; 沟通 更 加 便捷 ，QQ、 微 信 等 网 络 工具 将 人 们 时 刻 
联系 在 一 起 ;购物 消费 更 加 容易 ， 利 用 手机 或 电脑 上 网 就 可 以 快速 实现 商品 交易 。 因 此 ， 
互联 网 的 发 展 不 仅 是 一 场 信 息 革命 ， 也 是 社会 变革 。 根 据 第 38 次 《中 国 互联 网 络 发 展 状 
况 统计 报告 》， 截 至 2016 年 6 月 ， 中 国 网 民 规模 达 7.10 亿 人 ， 其 中 手机 网 民 规 模 达 6.56 
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亿 人 ， 占 比 92.5%。 网 民 行 为 因为 互联 网 的 发 展 更 加 多 元 化 ， 文 本 、 图 片 、 音 频 、 视 频 、 
地 理 位 置 等 信息 已 经 成 为 大 数据 增长 最 快 的 来 源 。 

大 数据 与 计算 机 技术 和 互联 网 的 发 展 相辅相成 。 大 体 量 的 数据 采集 、 存 储 、 管 理 和 挖 
据 因 计算 机 和 互联 网 技术 的 快速 发 展 得 以 实现 ， 数 据 的 来 源 越 来 越 丰富 ， 形 成 信息 流 ， 大 
数据 的 信息 流 又 通过 社会 生活 和 商业 模式 带动 着 资金 流 和 物流 的 发 展 ， 进 一 步 推动 计算 机 
与 互联 网 技术 的 改进 。 大 数据 与 计算 机 和 互联 网 技术 相互 作用 ， 相 互 促进 ， 共 同 发 展 。 


1.1.2 大 数据 的 分 类 
大 数据 的 种 类 很 多 ， 可 以 依照 不 同 标准 进行 分 类 。 
1. 按照 大 数据 结构 特征 分 类 


按照 大 数据 结构 特征 ， 可 以 将 大 数据 分 为 结构 化 数据 、 非 结构 化 数据 和 半 结 构 化 
数据 。 

(1) 结构 化 数据 。 是 指 有 结构 的 数据 ， 也 即行 数据 ， 在 得 到 数据 之 前 ， 其 结构 就 是 确 
定 的 。 比 如 ， 传 统 的 关系 数据 模型 ， 可 用 二 维 结构 表示 。 二 维 表 中 的 数据 就 是 典型 的 结构 
化 数据 ， 其 结构 事先 通过 数据 模型 的 定义 确定 下 来 ， 在 处 理 过 程 中 不 会 改变 。 

(2) 非 结 构 化 数据 。 是 指 没有 结构 的 数据 ， 无 法 用 数据 库 的 二 维 逻 辑 结构 来 表现 。 包 
括 所 有 格式 的 文档 、 文 本 、 图 片 、 视 频 、 音 频 、 各 类 报表 以 及 标准 通用 标记 语言 下 的 子 集 
XML、HTML。 它 们 通常 没有 数据 模型 ， 无 法 进行 结构 化 处 理 。 

(3) 半 结 构 化 数据 。 是 指 介 于 结构 化 数据 和 非 结构 化 数据 之 间 的 数据 。 半 结构 化 数据 
也 是 有 结构 的 数据 ， 与 结构 化 数据 不 同 的 是 ， 半 结构 化 数据 是 先 有 数据 ， 再 有 结构 。 半 结 
构 化 数据 一 般 是 自 描述 的 ， 数 据 的 结构 和 内 容 混 合 在 一 起 ， 没 有 明显 的 区 分 ， 其 数据 模型 
是 数 和 图 。 常 见 的 半 结 构 化 数据 有 XML、HTML。 

2. 按照 大 数据 获取 处 理 方式 分 类 


按照 大 数据 获取 处 理 方式 ， 可 以 将 大 数据 分 为 批 处 理 数据 和 流 式 计算 数据 。 数 据 的 批 
处 理 是 指 对 数据 进行 批量 的 处 理 ， 如 对 数据 进行 成 批 的 增加 、 修 改 、 删 除 等 操作 。 流 式 计 
算是 指 可 以 在 实时 处 理 的 应 用 环境 中 ， 对 大 规模 流动 数据 在 不 断 变化 的 前 提 下 进行 持续 计 
算 、 分 析 并 能 捕捉 到 有 价值 信息 的 分 布 式 计算 模式 。 流 式 数据 具有 实时 性 、 易 失 性 、 突 发 
性 、 无 序 性 和 无 限 性 的 特点 。 大 数据 的 批 处 理 和 流 式 计算 的 区 别 如 下 表 所 示 。 


大 数据 批 处 理 与 流 式 计算 的 比较 
性 能 指标 大 数据 流 式 计算 大 数据 批 处 理 
计算 方式 实时 批量 
常 驻 空间 内 存 硬盘 
时 效 性 长 
有 序 性 有 
数据 量 有 限 
数据 速率 稳定 


i 


续 表 
性 能 指标 大 数据 流 式 计算 大 数据 批 处 理 
是 否 可 重 现 难 易 
数据 精确 度 较 低 较 高 


3. 按照 其 他 方式 分 类 


按照 大 数据 处 理 响应 性 能 ， 可 以 将 大 数据 分 为 实时 数据 、 非 实时 数据 和 准 实时 数据 ; 
按照 大 数据 关系 ， 可 以 将 大 数据 分 为 简单 关系 数据 和 复杂 关系 数据 ， 如 Web 日 志 是 简单 关 
系数 据 ， 社 会 网 络 等 具有 复杂 关系 的 图 计算 属于 复杂 关系 数据 。 


1.1.3 大 数据 的 价值 


大 数据 最 大 的 价值 ， 是 能 够 通过 挖掘 数据 之 间 的 相关 性 ， 把 模糊 的 、 隐 含 的 、 时 滞 性 
的 问题 ， 以 可 视 化 的 、 明 确 的 、 预 演 的 方式 展现 出 来 ， 以 便于 决策 和 管理 单元 采取 措施 ， 
改变 所 暴露 的 问题 。 这 和 传统 的 数据 分 析 有 着 明显 的 不 同 。 以 往 的 数据 分 析 或 商业 智能 ， 
更 多 的 是 面向 过 去 已 经 发 生 的 ， 而 大 数据 是 面向 未 来 即将 发 生 的 。 对 金融 行业 来 说 ， 大 数 
据 主要 有 如 下 几 点 价值 ( 见 图 1.4)。 


图 1.4 大 数据 在 金融 行业 中 的 价值 

1. 销售 机 会 增多 

金融 企业 掌握 了 海量 的 资金 往来 数据 ， 再 结合 用 户 搜 索 行为 、 浏 览 行为 、 交 易 行 为 、 
评论 历史 、 个 人 资料 等 数据 ， 金 融 企业 可 以 洞察 消费 者 的 整体 需求 ， 进 而 有 针对 性 地 进行 
产品 生产 、 改 进 和 营销 。《 纸 牌 屋 》 选 择 演员 和 剧情 、 百 度 基于 用 户 喜 好 进行 精准 广告 营 
销 、 阿 里 根据 天 猫 用 户 特征 包 下 生产 线 定制 产品 、 亚 马 进 预 测 用 户 点 击 行为 提前 发 货 均 是 
受益 于 互联 网 用 户 行为 预测 。 

2. 客户 服务 改善 

大 数据 的 应 用 可 以 有 效 地 改善 客户 服务 。 大 数据 不 仅 可 以 分 析 量 化 数据 ， 还 可 以 进行 


文本 、 语 音 分 析 。 在 客户 体验 方面 ， 通 过 对 交易 数据 、 多 渠道 交互 数据 、 社 交 媒 体 数 据 等 
的 全 面 分 析 ， 帮 助 企 业 真正 了 解 客户 需求 ， 并 预测 客户 未 来 行为 ， 从 而 为 客户 提供 更 好 的 
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服务 。 在 客户 情感 分 析 方 面 ， 通 过 对 客服 中 心 、 社 交 媒 体 等 数据 的 文本 分 析 、 语 音 分 析 ， 
洞察 客户 情绪 变化 ， 分 析 客 户 的 兴趣 点 、 异 常 行为 、 意 见 、 态 度 等， 指导 相关 部 门 制定 销 
售 策略 、 市 场 策略 等 ， 并 优化 改进 客户 服务 。 


3. 客户 流失 预警 


开发 新 客户 往往 比 留 住 老 客 户 要 付出 更 高 的 成 本 。 大 数据 技术 的 应 用 可 以 预警 客户 流 
失 ， 减 少 客户 流失 率 。 利 用 大 数据 技术 分 析 用 户 在 整个 相关 产品 里 的 使 用 行为 的 数据 ， 识 
别 可 能 流失 的 客户 以 及 可 能 导致 客户 放弃 的 原因 ， 如 客户 对 产品 不 满意 、 对 服务 不 满意 、 
因为 其 他 竞争 对 手 等 ， 以 便 企 业 及 时 采取 策略 ， 进 行 积极 有 效 的 改进 。 研 究 表明 ， 客 户 在 
最 终 离开 之 前 ， 很 可 能 会 持续 关注 或 已 经 购买 了 竞争 对 手 的 产品 ， 这 些 可 以 依据 大 数据 进 
行 探查 。 

4. 金融 产品 创新 

大 数据 应 用 为 金融 行业 突破 传统 金融 产品 带 来 了 革新 。 高 端 数据 分 析 系 统 和 综合 化 数 
据 分 享 平台 能 够 有 效 地 对 接 银行 、 保 险 、 信 托 、 基 金 等 各 类 金融 产品 ， 使 金融 企业 能 够 从 
其 他 领域 借鉴 并 创造 出 新 的 金融 产品 。 国 内 的 数据 挖掘 最 早 基本 也 是 基于 授信 所 需要 的 分 
类 挖掘 算法 而 发 展 的 。 比 如 ， 金 融 贷款 产品 正在 从 抵押 贷款 向 无 抵押 贷款 演变 ， 通 过 大 数 
据 应 用 建立 信用 评估 机 制 ， 极 大 地 提高 了 信用 风险 评级 的 及 时 性 和 准确 性 ， 抵 押 贷 款 模式 
正在 逐步 被 信用 贷款 模式 所 取代 。 


5. 运营 效率 提升 


在 销售 运营 方面 ， 金 融 机 构 能 够 通过 现 有 客户 的 人 际 网 络 或 业务 网 络 ， 发 现 更 多 有 价 
值 的 潜在 客户 ， 利 用 大 数据 的 分 析 和 预测 模型 ， 实 现 对 客户 消费 模式 和 购买 需求 的 分 析 ， 
针对 其 个 性 需要 展开 精准 营销 ， 大 大 提升 销售 运营 效率 。 在 业务 流程 方面 ， 通 过 大 数据 在 
存储 和 处 理 方面 的 优势 ， 各 种 数据 可 被 直接 推送 到 需要 这 些 信 息 的 岗位 ， 信 息 传递 的 中 间 
环节 被 压缩 ， 业 务 流程 得 到 简化 ， 从 而 带 来 巨大 的 效率 提升 空间 。 在 资金 需求 预测 方面 ， 
可 以 借助 大 数据 构建 资金 需求 预测 模型 ， 实 现 对 资金 需求 的 有 效 预算 ， 帮 助 金融 企业 提高 
周转 效率 。 

6. 商业 模式 创新 


互联 网 金融 和 大 数据 技术 正在 对 传统 金融 产生 巨大 冲击 ， 大 数据 打破 了 信息 不 对 称 的 
局 面 ， 给 金融 商业 模式 带 来 了 重大 变化 。 一 个 很 重要 的 表现 形式 是 大 数据 的 征 信和 网 络 贷 
款 ， 可 以 根据 企业 行为 数据 计算 出 企业 可 能 违约 的 概率 ， 在 这 个 基础 上 进行 贷款 ， 比 如 当 
前 典型 的 阿里 小 贷 。 未 来 基于 大 数据 的 保险 也 是 这 样 的 ， 根 据 行为 的 数据 进行 保险 差别 的 
定价 。 比 如 ， 通 过 对 人 体 的 心率 、 体 重 、 血 脂 、 血 糖 、 运 动量 、 睡 眠 量 等 数据 分 析 ， 预 测 
客户 的 健康 指数 ， 帮 助人 身 保险 公司 提高 客户 识别 率 ， 以 此 制定 个 性 化 的 费 率 和 承保 
方案 。 


EO mL 


7. 风险 管控 加 强 


由 于 金融 的 本 质 是 对 风险 的 控制 和 管理 ， 这 一 特点 决定 了 金融 企业 在 风险 管控 方面 的 
重视 程度 远 远 高 于 其 他 行业 。 风 险 管控 是 金融 企业 运营 中 的 一 个 重要 组 成 部 分 。 风 险 发 现 
得 越 早 ， 挽 回 损失 的 概率 越 大 。 大 数据 的 运用 将 大 大 有 助 于 金融 企业 提升 风险 管控 能 力 ， 
通过 对 最 底层 交易 数据 的 全 面 甄别 和 分 析 ， 使 企业 能 够 提高 风险 透明 度 ， 实 现 事前 预警 、 
事 中 控制 。 比 如 ， 大 数据 可 以 帮助 银行 建立 动态 的 、 可 靠 的 信用 系统 ， 识 别 高 风险 客户 以 
及 各 种 交易 风险 ， 进 而 有 效 地 进行 防范 和 控制 。 

金融 行业 的 业务 范围 是 由 客户 、 交 易 、 资 金 、 场 所 共同 组 成 的 联合 体 ， 任 何 一 个 要 素 
的 变化 ， 都 有 可 能 带 来 意 想不到 的 价值 。 


(OD 于 IE》 大 数据 应 用 领域 


2012 年 《纽约 时 报 》 的 一 篇 文章 标志 着 人 类 社会 进入 大 数据 时 代 ， 大 数据 影响 着 每 一 
个 人 ， 并 在 可 以 预见 的 未 来 继续 影响 着 整个 人 类 和 社会 。 大 数据 冲击 着 许多 主要 行业 ， 大 
数据 也 在 彻底 地 改变 着 我 们 的 生活 ， 未 来 大 数据 产业 将 会 是 一 个 很 大 的 市 场 。 目 前 ， 大 数 
据 已 被 广泛 应 用 于 各 个 行业 ， 本 书 将 主要 为 大 家 介绍 大 数据 在 商业 、 通 信 、 医 疗 和 金融 这 
些 应 用 比较 早 的 领域 中 的 应 用 。 


1.2.1 商业 


商业 是 大 数据 应 用 最 广泛 的 领域 。 商 业 大 数据 的 来 源 可 分 为 两 个 方面 :一 方面 是 大 交 
易 数 据 ， 即 商业 交易 产生 的 数据 ， 包 括 商品 数据 、 市 场 竞争 数据 、 运 营 数据 、 销 售 数据 、 
顾客 关系 数据 和 财务 数据 ， 另 一 方面 是 大 交互 数据 ， 商 业 企业 与 顾客 之 间 通 过 POS、 互 联 
网 、 物 联网 、 移 动 终端 、 智 能 终端 、 传 感 器 和 观测 设备 等 产生 的 交互 信息 ， 主 要 包括 社交 
网 络 数据 、 射 频 识别 数据 、 时 间 和 位 置 数据 、 文 本 数据 和 观测 数据 。 大 数据 在 商业 中 的 应 
用 可 以 归纳 为 以 下 4 个 方面 ( 见 图 1.5)。 


。 客 户 洞 察 。 需 求 预测 。 商 品 分 组 。 仓 储 管理 


。 客 户 细 分 。 个 性 化 。 结 构 调整 。 供 应 链 
。 动 态 定位 服务 提 效 


图 1.5 大 数据 在 商业 中 的 应 用 
1. 客户 


在 客户 方面 ， 大 数据 的 应 用 主要 包括 客户 洞察 、 客 户 细 分 和 动态 定位 。Q 客 户 洞察 。 
互联 网 、 物 联网 等 的 顾客 数据 痕迹 能 真实 而 直接 地 反映 消费 者 的 性 格 、 偏 好 和 意愿 。@ 客 
户 细 分 。 传 统 的 以 地 理 位 置 、 人 口 统计 特征 为 标准 的 划分 被 以 爱好 兴趣 、 生 活 方式 、 价 值 
观 、 沟 通 方式 为 标准 的 数据 化 细 分 所 替代 ; 本 质 上 讲 ， 每 个 人 的 兴趣 、 爱 好 与 需求 都 不 
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同 ， 每 个 人 都 是 一 个 细 分 市 场 ， 大 数据 正在 使 零售 企业 向 “ 微 市 场 ”迈进 ， 构 建 基于 大 数 
据 的 顾客 购买 行为 模型 ， 主 动 推荐 个 性 化 的 产品 和 服务 。@@ 动 态 定位 。 零 售 业 多 来 源 、 多 
格式 数据 的 集成 、 分 析 与 解释 能 力 使 数据 的 反馈 与 响应 可 在 瞬间 完成 ， 快 速 识别 消费 者 的 
购买 决策 和 行为 模式 的 变化 趋势 ， 及 时 准确 地 更 新 他 们 的 偏好 。 


2. 市 场 


在 市 场 方面 ， 大 数据 的 应 用 主要 包括 需求 预测 和 个 性 化 服务 。 中 需求 预测 。 通 过 对 建 
构 的 大 数据 进行 统计 与 分 析 ， 采 取 科 学 的 预测 方法 ， 建 立 数学 模型 ， 使 企业 管理 者 掌握 和 
了 解 零售 行业 潜在 的 市 场 需求 ， 未 来 一 段 时 间 每 个 细 分 市 场 的 产品 销售 量 和 产品 价格 走势 
等 ， 从 而 使 企业 能 够 通过 价格 的 杠杆 来 调节 市 场 的 供需 平衡 ， 并 针对 不 同 的 细 分 市 场 来 实 
行动 态 定价 和 差别 定价 。@ 个 性 化 服务 。 根 据 客户 的 购买 频次 、 兴 趣 点 、 忠 诚 度 和 流失 的 
可 能 性 预测 客户 的 消费 意愿 ， 主 动 为 其 提供 个 性 化 的 销售 和 关怀 指导 服务 ， 调 高 销售 额 和 
利润 率 。 

3. 商品 


在 商品 方面 ， 大 数据 的 应 用 主要 包括 商品 分 组 和 商品 结构 调整 。 中 商品 分 组 。 通 过 对 
代销 记录 信息 的 分 析 ， 可 以 发 现 购买 某 一 种 商品 的 顾客 可 能 购买 其 他 商品 。 这 类 信息 可 用 
于 一 定 的 购买 推荐 ， 或 者 保持 一 定 的 最 佳 商品 分 组 布局 ， 以 帮助 客户 选择 商品 ， 刺 激 顾客 
的 购买 欲望 从 而 达到 增加 销售 额 、 节 省 顾客 购买 时 间 的 目的 。@ 商 品 结构 调整 。 通 过 对 销 
售 数据 和 商品 基础 数据 的 分 析 ， 来 指导 企业 商品 结构 的 调整 ， 加 强 所 营 商 品 的 竞争 能 力 和 
合理 配置 。 


4. 供应 链 


在 供应 链 方面 ， 大 数据 的 应 用 主要 包括 仓储 管理 和 供应 链 提 效 。@ 仓 储 管理 。 通 过 对 
销售 数据 和 库存 数据 的 分 析 ， 决 定 各 种 商品 的 增 减 数量 ， 确 保 正确 的 库存 。@@ 供 应 链 提 
效 。 具 体 包括 选择 供应 商 ， 优 化 物流 、 现 金 流 和 配置 人 力 资源 等 。 利 用 大 数据 技术 ， 优 化 
整合 供应 链 的 各 个 环节 ， 构 建 一 个 统一 的 供应 链 平 台 ， 各 部 门 共享 供应 链 平台 的 数据 和 服 
务 ， 快 速 灵活 地 应 对 顾客 消费 变化 ， 降 低 供应 链 成 本 ， 提 高 商品 采购 、 仓 储 管理 、 物 流 配 
送 和 最 终 销 售 之 间 的 运行 效率 。 

大 数据 在 零售 商业 中 已 有 很 多 成 功 的 应 用 案例 。 沃 尔 玛 通过 对 消费 者 购物 行为 等 这 种 
非 结构 化 数据 的 分 析 ， 了 解 顾客 购物 习惯 ， 通 过 销售 数据 分 析 适 合 搭配 在 一 起 购买 的 商 
品 ， 创 造 了 啤酒 与 尿布 的 经 典 商 业 案例 ; 淘宝 数据 魔方 通过 对 消费 者 行为 的 分 析 帮 助 商家 
了 解 淘宝 平台 上 的 行业 宏观 情况 、 自 己 品 牌 的 市 场 状 况 ， 据 此 进行 生产 、 库 存 决策 ， 美 国 
折扣 零售 商 target 使 用 大 数据 分 析 ， 对 顾客 怀孕 趋势 进行 评分 ， 比 较 准 确 地 预测 了 预 产 
期 ， 以 此 在 每 个 孕期 阶段 为 客户 寄 送 相应 的 优惠 券 。 在 未 来 几 十 年 ， 数 据 分 析 技 术 将 不 断 
地 进步 ， 商 业 领 域 将 对 组 织 、 营 销 与 管理 进行 突破 性 的 创新 。 


1.2.2 ”通信 
通信 行业 数据 来 源 广泛 ， 不 仅 涉及 移动 语音 、 固 定 电话 、 固 网 接 入 、 无 线 上 网 等 业 
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务 ， 还 会 涉及 公众 客户 、 政 企 客户 和 家 庭 客户 ， 同 时 也 会 收集 到 实体 渠道 、 电 子 渠 道 、 直 
销 渠道 等 所 有 类 型 渠道 的 接触 信息 。 通 信行 业 发 展 至 今 积 累 了 非常 丰富 的 数据 ， 既 拥有 财 
务 收入 、 业 务 发 展 等 结构 化 数据 ， 还 会 涉及 图 片 、 文 本 、 音 频 、 视 频 等 非 结构 化 数据 。 目 
前 ， 大 数据 在 通信 行业 的 应 用 还 处 于 探索 阶段 ， 主 要 包括 网 络 管理 和 优化 、 市 场 与 精准 营 
销 、 客 户 关 系 管理 、 企 业 运营 管理 和 数据 商业 化 5 个 方面 ， 如 图 1.6 所 示 。 


网 络 管理 和 优化 图 市 场 与 精准 营销 数据 商业 化 


。 基 础 设施 建 “客户 画像 “客服 中 心 优 化 业务 运营 监控。 。 营 销 洞察 和 


设 优化 。 关 系 链 研究 。 客 户 关怀 与 生 。 。 经 营 分 析 和 市 。 精准 广告 
。 网 络 运 营 管 。 精 准 营销 命 周 期 管理 场 监测 。 大 数据 监测 
理 和 优化 。 实 时 营销 和 决策 

。 个 性 化 推荐 


1.6 ”通信 行业 大 数据 应 用 
1. 网 络 管理 和 优化 


网 络 管理 和 优化 包括 基础 设施 建设 优化 和 网 络 运 营 管理 和 优化 。Q@ 在 基础 设施 建设 层 
面 ， 运 营 商 运用 大 数据 选择 基站 和 热点 的 位 置 并 有 效 地 分 配 资源 。 例 如 ， 对 话 单 和 信 令 中 
用 户 的 流量 在 时 间 周 期 和 位 置 特点 方面 的 分 布 进行 分 析 ， 将 4G 基站 和 WLAN 热点 建立 在 
2G、3G 的 高 流量 区 域 ， 与 此 同时 ， 对 已 有 基站 的 效率 和 成 本 建立 评价 模型 ， 发 现 基站 建 
设 的 资源 浪费 问题 。@ 在 网 络 运 营 方 面 ， 运 营 商 可 以 利用 大 数据 分 析 网 络 的 流量 和 变化 趋 
势 及 时 调整 资源 配置 ， 通 过 对 网 络 日 志 进 行 分 析 优 化 网 络 ， 提 升 网 络 质量 和 利用 率 。@@ 在 
网 络 优化 方面 ， 运 营 商 可 以 运用 大 数据 技术 实时 监控 网 络 状况 ， 对 各 个 小 区 的 网 络 数据 进 
行 综合 分 析 ， 识 别 业务 热点 小 区 ， 依 次 设 定 网 络 优化 的 优先 级 ， 实 现 网 络 和 用 户 的 智能 指 
配 ， 提 高 投资 效率 。 


2. 市 场 与 精准 营销 


市 场 与 精准 营销 包括 客户 画像 、 关 系 链 研 究 、 精 准 营 销 、 实 时 营销 和 个 性 化 推荐 。 
名 客 户 画像 。 运 营 商 根据 客户 终端 信息 、 地 理 位 置 、 通 话 行为 数据 挖掘 对 客户 群体 进行 分 
类 ， 给 每 个 客户 打上 行为 和 爱好 标签 ， 完 善 客户 画像 ， 有 助 于 运营 商 深入 了 解 客户 的 行为 
偏好 和 需求 。 包 关系 链 研 究 。 运 营 商 可 以 运用 客户 资料 和 通话 行为 等 数据 分 析 客 户 交往 
圈 ， 发 现 高 流量 用 户 ， 寻 找 营销 机 会 ， 从 而 节约 成 本 ， 提 高 营销 效率 。@@ 精 准 营销 。 运 营 
商 可 以 通过 大 数据 技术 对 用 户 终端 的 消费 能 力 、 消 费 偏 好 和 近期 特征 事件 进行 分 析 ， 预 测 
用 户 需 求 ， 精 准 匹配 用 户 和 通信 相关 业务 ， 寻 找 合适 的 推送 渠道 、 推 送 时 间 ， 实 现 精 准 营 
销 。 多 个 性 化 推荐 。 运 营 商 可 以 通过 对 客户 画像 信息 、 终 端 信息 、 行 为 偏好 等 的 分 析 ， 向 
客户 提供 定制 化 服务 ， 优 化 产品 设计 和 定价 机 制 ， 实 现 个 性 化 推荐 和 服务 ， 提 升 客户 
体验 。 


3. 客户 关系 管理 
客户 关系 管理 包括 客服 中 心 优 化 、 客 户 关 怀 和 客户 生命 周期 管理 。 叫 客服 中 心 优化 。 
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首先 ， 运 营 商 可 以 通过 对 客服 中 心 积累 的 客户 的 呼叫 行为 和 需求 数据 进行 大 数据 分 析 ， 运 
用 呼 入 客户 行为 数据 和 客户 历史 情况 建立 客服 热线 智能 路 径 模 型 ， 预 测 客户 的 投诉 风险 ， 
从 而 提升 客服 满意 度 。 其 次 ， 根 据 语义 分 析 ， 识 别 热点 问题 和 客户 情绪 ， 通 知 相关 部 门 进 
行 优化 。 外 客户 关怀 与 客户 生命 周期 管理 。 一 是 获取 客户 阶段 ， 可 以 运用 大 数据 技术 挖掘 
和 发 现 潜在 客户 。 二 是 客户 发 展 阶段 ， 运 用 关联 规则 等 数据 挖掘 方法 进行 交叉 销售 ， 促 进 
客户 消费 。 三 是 客户 成 熟 阶段 ， 利 用 大 数据 对 客户 群 进行 分 类 ， 实 施 精准 营销 ， 同 时 对 不 
同 客户 进行 个 性 化 推荐 。 四 是 客户 衰退 阶段 ， 采 用 预警 模型 预先 发 现 高 流失 风险 客户 ， 做 
出 相应 的 客户 关怀 。 五 是 客户 离开 阶段 ， 通 过 大 数据 挖掘 高 潜 回流 客户 ， 推 出 客户 感 兴趣 
的 业务 ， 防 止 流失 。 

4. 企业 运营 管理 

企业 运营 管理 ， 包 括 业 务 运 营 监 控 、 经 营 分 析 和 市 场 监测 。Q(D 业 务 运营 监控 。 运 营 商 
可 以 运用 大 数据 技术 从 网 络 、 业 务 、 用 户 等 多 个 方面 为 运营 商 监 控 管道 和 客户 运营 情况 。 
此 外 ， 还 可 以 建立 KQI、KPI 等 指标 体系 和 异动 智能 监控 体系 ， 全 面 、 及 时 、 准 确 地 监控 
业务 运用 情况 。@ 经 营 分 析 和 市 场 监测 。 运 营 商 可 以 通过 分 析 企 业内 部 的 业务 和 用 户 数据 
以 及 通过 大 数据 技术 采集 的 外 部 社交 网 络 数据 和 市 场 数据 ， 对 业务 和 市 场 经 营 状况 进行 总 
结 ， 主 要 包括 经 营 日 报 、 周 报 、 月 报 、 季 报 和 年 报 。 


5. 数据 商业 化 


数据 商业 化 是 指 企业 通过 自身 拥有 的 大 数据 资产 进行 对 外 商业 化 ， 获 得 番 利 。 相 比 于 
国外 ， 国 内 的 数据 商业 化 还 处 于 探索 阶段 。 数 据 商业 化 包括 营销 洞察 、 大 数据 监测 和 决策 
支撑 服务 。Q@ 营 销 洞察 。 美 国电 信 运 营 商 Verizon 成 立 了 专门 的 精准 营销 部 门 ， 主 要 用 于 
提 
对 


是 供 精 准 营 销 洞察 和 商业 数据 分 析 服 务 。 例 如 ， 在 美国 商家 最 为 看 中 的 营销 场合 ，Verizon 
观众 的 来 源 进行 了 精确 的 数据 分 析 ， 球 队 因此 能 够 了 解 到 观众 对 赞助 商 的 喜好 等 。@ 大 
数据 监测 和 决策 。 在 客流 和 选 址 方面 ， 西 班 牙 电 信 成 立 了 动态 洞察 部 门 开展 大 数据 业务 ， 
主要 为 客户 提供 数据 分 析 打 包 服 务 。 该 公司 与 市 场 研究 机 构 GFK 进行 合作 推出 的 产品 
“智慧 足迹 ”通过 完全 匿名 和 聚合 的 移动 网 络 数据 ， 帮 助 零售 商 分 析 顾 客 来 源 和 各 商铺 、 
展位 的 人 流 情 况 以 及 消费 者 特征 和 消费 能 力 ， 并 将 洞察 结果 面向 政 企 客户 提供 客流 分 析 和 
零售 店 选 址 服务 。 在 公共 事业 服务 方面 ， 法 国电 信 运 营 商 的 通信 和 解决 方案 部 门 承担 了 法 国 
很 多 公共 服务 项 目的 IT 系统 建设 ， 如 法 国 高 速 公路 数据 监测 项 目 ， 对 其 每 天 产生 的 记录 
进行 分 析 就 可 以 为 行驶 的 车 辆 提供 准确 及 时 的 路 况 信息 ， 从 而 有 效 提高 道路 通畅 率 。 

由 于 我 国运 营 商 的 区 域 化 运营 ， 由 各 地 区 分 公司 分 别 存储 通信 企业 的 数据 ， 而 没有 统 
一 和 整合 ， 导 致 数据 孤岛 效应 严重 。 因 此 ， 我 国 通信 大 数据 仍然 处 于 初级 探索 阶段 。 通 信 
行业 数据 的 整合 和 统一 是 大 数据 运用 的 重要 一 步 。 我 国 通信 行业 目前 正 着 手 准 备 这 方面 的 
工作 ， 相 信 中 国 的 通信 行业 大 数据 发 展 在 互联 网 的 竞争 压力 下 会 更 快 。 


2S 
医疗 行业 拥有 大 量 病例 、 病 理 报告 、 医 疗 方案 、 药 物 报告 等 。 如 果 对 这 些 数 据 进行 整 
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理 和 分 析 ， 将 会 极 大 地 帮助 医生 和 病人 。 医 疗 行业 大 数据 目前 尚未 统一 收集 起 来 ， 无 法 进 
行 大 规模 应 用 。 在 未 来 ， 借 助 于 大 数据 平台 我 们 可 以 收集 疾病 的 基本 特征 、 病 例 和 治疗 方 
案 以 及 病人 的 基本 特征 ， 建 立 针对 疾病 特点 的 数据 库 ， 帮 助 医生 进行 疾病 诊断 。 医 疗 行业 
大 数据 来 源 如 图 1.7 所 示 。 


制药 行业 
和 科研 
数据 


全 
@'.0 
是 


1.7 ”医疗 行业 大 数据 来 源 


大 数据 在 医疗 行业 中 的 应 用 主要 包括 临床 操作 、 付 款 / 定 价 、 研 发 、 新 的 商业 模式 、 公 
共 健 康 这 5 个 方面 ， 如 图 1.8 所 示 。 


临床 操作 “国人 起/ 定价 新 的 商业 模式 
rade ree 
.类 二 省 邓 你 。 攻 设计 的 和 但 估 兴 数 。 公关 人 
持 系 统 研究 的 定价 。 计 工 具 和 算 。 据 控 
“医疗 数据 过。 计划 法 “网 络 平台 和 

明度 社区 

“远程 

六 

“对 病人 档案 

的 高 级 分 析 


病人 行为 
和 情绪 
数据 


图 1.8 大 数据 在 医疗 行业 中 的 应 用 
1. 临床 操作 


临床 操作 包括 比较 效果 研究 、 临 床 决策 交 持 系统 、 医 疗 数据 透明 度 、 远 程 病人 监控 和 
对 病人 档案 的 高 级 分 析 。 例 如 ， 通 过 对 病人 的 体征 数据 、 费 用 数据 和 疗效 数据 在 内 的 大 型 
数据 集 进行 精准 分 析 ， 比 较 多 种 干预 措施 的 有 效 性 可 以 针对 特定 病人 找到 最 有 效 和 最 具有 
成 本 效益 的 治疗 方法 ， 使 用 图 像 分 析 和 识别 技术 ， 识 别 医疗 影像 (X 光 、CT、MRT) 数 据 ， 
或 者 挖掘 医疗 文献 数据 建立 医疗 专家 数据 库 ， 从 而 给 医生 提出 诊疗 建议 ， 根 据 医疗 服务 提 
供 方 设置 的 操作 和 绩效 数据 集 ， 可 以 进行 数据 分 析 并 创建 可 视 化 的 流程 图 和 仪表 盘 ， 促 进 
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信息 透明 ， 帮 助 病人 做 出 更 明智 的 健康 护理 决定 ， 间 接 提 高 医疗 服务 的 质量 ， 从 对 慢性 病 
人 的 远程 监控 系统 收集 数据 ， 并 将 结果 反馈 给 监控 设备 (查看 病人 是 否 遵从 医嘱 )， 从 而 确 
定 今后 的 用 药 和 治疗 方案 ， 对 病人 档案 的 高 级 分 析 ， 确 定 各 类 疾病 的 易 感人 群 ， 识 别 患 病 
风险 ， 使 他 们 尽早 接受 预防 性 保健 方案 。 


2. 付款 /定价 


付款 /定价 包括 自动 化 系统 、 基 于 卫生 经 济 学 和 疗效 研究 的 定价 计划 。 例 如 ， 利 用 自动 
化 系统 (机 器 学 习 技术 ) 对 索赔 数据 进行 分 析 和 挖掘 ， 可 以 检测 出 索赔 准确 性 ， 在 支付 发 生 
前 识别 欺诈 行为 ， 避 免 重 大 的 损失 ， 利 用 数据 分 析 横 向 医疗 服务 提供 方 的 服务 ， 并 依据 服 
务 水 平 进行 定价 。 

3. 研发 


研发 包括 预测 健康 、 调 高 临床 实验 设计 的 统计 工具 和 算法 、 临 床 试验 数据 的 分 析 、 个 
性 化 治疗 以 及 疾病 模式 的 分 析 。 例 如 ， 医 药 公 司 在 新 药物 的 研发 阶段 可 以 基于 药物 临床 试 
验 阶 段 之 前 的 数据 集 及 早期 临床 阶段 的 数据 集 ， 及 时 地 预测 临床 结果 ， 在 临床 试验 阶段 通 
过 统计 工具 和 算法 挖掘 病人 数据 ， 评 估 招 募 患者 是 否 符合 试验 条 件 ， 加 快 临床 试验 进程 ; 
根据 临床 试验 数据 和 病人 记录 确定 药品 更 多 的 适应 证 以 及 从 中 发 现 副作用 ; 通过 对 大 型 数 
据 集 ( 如 基因 组 数据 ) 的 分 析 发 展 个 性 化 治疗 ， 对 疾病 的 模式 和 趋势 分 析 ， 帮 助 医疗 产品 企 
业 制 定 战略 性 的 研发 投资 决策 ， 优 化 研发 重点 和 配备 资源 。 


4. 新 的 商业 模式 


新 的 商业 模式 包括 汇总 患者 的 临床 记录 和 医疗 保险 数据 集 、 网 络 平台 和 社区 。 例 如 ， 
汇总 患者 的 临床 记录 和 医疗 保险 数据 集 ， 并 进行 高 级 分 析 ， 将 提高 医生 和 医药 企业 的 决策 
能 力 。 在 医生 诊断 病人 时 可 以 参考 病人 的 疾病 特征 、 化 验 报告 和 检测 报告 ， 参 考 疾病 数据 
库 来 快速 帮助 病人 确诊 ， 明 确定 位 疾病 。 在 制定 治疗 方案 时 ， 医 生 可 以 依据 病人 的 基因 特 
点 ， 调 取 相 似 基 因 、 年 龄 、 人 种 、 身 体 情 况 相同 的 有 效 治疗 方案 ， 制 定 出 适合 病人 的 治疗 
方案 ， 帮 助 更 多 人 及 时 进行 治疗 。 同 时 这 些 数据 也 有 利于 医药 行业 开发 出 更 加 有 效 的 药物 
和 医疗 器 械 。 另 一 个 潜在 的 大 数据 启动 的 商业 模型 是 网 络 平台 和 大 数据 ， 这 些 平 台 已 经 产 
生 了 大 量 有 价值 的 数据 : 包括 病人 的 问 诊 数据 、 医 生 的 学 习习 惯 等 。 


5. 公共 健康 


大 数据 的 使 用 可 以 改善 公众 健康 监控 。 公 共 卫 生 部 门 可 以 通过 覆盖 全 国 的 患者 电子 病 
历数 据 库 ， 快 速 检测 传染 病 ， 进 行 全面 的 疫情 监测 ， 并 通过 集成 疾病 监测 和 响应 程序 ， 快 
速 进行 响应 。 这 将 带 来 很 多 好 处 ， 包 括 医疗 索赔 支出 减少 、 传 染病 感染 率 降 低 ， 卫 生 部 门 
可 以 更 快 地 检测 出 新 的 传染 病 和 疫情 。 通 过 提供 准确 和 及 时 的 公众 健康 咨询 ， 将 会 大 幅 提 
高 公众 健康 风险 意识 ， 同 时 也 将 降低 传染 病 感染 风险 。 所 有 的 这 些 都 将 帮助 人 们 创造 更 好 
的 生活 。 

大 数据 将 会 对 医疗 行业 产生 巨大 的 影响 和 推动 ， 它 可 以 揭露 健康 的 影响 因素 ， 将 最 合 
适 的 治疗 方式 推荐 给 患者 ;能够 促进 新 的 发 现 ， 优 化 治疗 结果 和 削减 开支 。 但 目前 大 数据 
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医疗 也 面临 着 患者 隐私 安全 、 海 量 数据 收集 难题 、 区 域 医疗 共享 以 及 技术 方面 的 挑战 。 随 
着 信息 化 技术 的 发 展 ， 这 些 问 题 将 逐步 得 到 解决 。 可 以 预见 ， 在 不 久 的 未 来 ， 大 数据 的 应 
用 将 渗透 到 医疗 应 用 的 更 多 领域 。 


1.2.4 金融 


在 国外 ， 大 数据 在 金融 行业 中 的 应 用 开展 较 早 。 例 如 ， 美 国 银行 运用 客户 点 击 数 据 集 
为 客户 提供 特色 服务 ， 包 括 有 竞争 性 的 信用 额度 ， 花 旗 银 行 运用 IBM 沃 森 电脑 为 财富 管理 
客户 推荐 产品 。 中 国 金融 行业 大 数据 应 用 主要 在 近 几 年 运用 较为 广泛 ， 很 多 金融 机 构建 立 
了 大 数据 平台 ， 采 集 和 处 理 金融 行业 的 交易 数据 ， 主 要 应 用 于 金融 行业 的 营销 、 服 务 、 运 


营 和 风 控 4 个 方面 ， 如 图 1.9 所 示 。 


精准 营销 “优化 客户 服务 “提升 运营 效率 “信用 风险 评估 
“社交 化 营销 De "决策 支持 “欺诈 风险 管理 


图 1.9 大 数据 在 金融 行业 的 应 用 
1. 营销 


1) ”精准 营销 

精准 营销 是 指 根据 客户 的 消费 偏好 和 消费 能 力 确 定 目 标 客 户 ， 推 荐 个 性 化 产品 。 例 
如 ， 银 行 对 客户 刷卡 、 存 款 取款 、 银 行 转账 、 微 信 评 论 等 行为 数据 进行 整理 和 分 析 ， 定 期 
向 客户 推送 广告 信息 ， 包 括 客户 可 能 感 兴趣 的 产品 和 优惠 信息 ; 信用卡 中 心 可 以 利用 大 数 
据 追 踪 热 点 消息 ， 针 对 特定 人 群 提供 产品 ， 如 热 映 电影 、 娱 乐 活动 、 美 食 饮品 等 ， 证 券 公 
司 可 以 通过 大 数据 分 析 为 特定 企业 提供 融资 融 券 产品 ， 保 险 公 司 可 以 根据 大 数据 定制 有 针 
对 性 的 保险 产品 。 精 准 营销 的 具体 流程 如 图 1.10 所 示 。 


。 根 据 用 户 标签 需 。 通 过 数据 挖掘 、 。 数 据 来 源 更 新 ， 。 用 户 画像 结果 数 
求 建立 各 个 标签 多 维 分 析 、 统 计 周期 性 地 进行 模 据 应 用 到 精准 营 
数据 来 源 的 数据 技术 建立 各 种 模 型 学 习 更 新 ， 同 销 ， 定 向 推荐 金 
基础 平台 于 步 更 新 用 户 画像 融 产品 

出 数据 


图 1.10 ”精准 营销 流程 


2) ”社交 化 营销 
社交 化 营销 是 指 利用 社交 平台 的 数据 资源 ， 结 合 大 数据 分 析 进 行营 销 。 金 融 行业 可 以 
开展 成 本 较 低 的 社交 化 营销 ， 和 凭借 开放 的 互联 网 平台 ， 通 过 对 大 量 的 客户 需求 数据 进行 分 
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析 ， 进 行 产 品 和 渠道 推广 。 然 后 依据 互联 网 社交 平台 反馈 的 用 户 数据 ， 评 价 营销 方案 的 可 
行 性 ， 利 用 口碑 营销 和 病毒 式 传播 来 帮助 金融 行业 快速 进行 产品 宣传 、 品 牌 宣传 、 渠 道 宣 
传 等 。 

2. 服务 


1) ”优化 客户 服务 

银行 可 以 根据 大 数据 分 析 ， 在 节假日 问候 客户 ， 为 客户 提供 定制 服务 ， 预 知 网 点 客户 
的 未 来 资金 需求 ， 提 前 进行 预约 ， 提 高 客户 体验 ; 私人 银行 还 可 以 通过 大 数据 分 析 ， 代 理 
客户 参与 金融 市 场 投资 ， 获 取 超 额 利润 ， 优 化 客户 服务 。 证 券 公司 可 以 通过 大 数据 分 析 ， 
快速 推出 相应 的 行业 报告 和 市 场 趋势 报告 ， 以 利于 投资 者 及 时 了 解 热点 ， 优 化 客户 服务 ; 
保险 公司 可 以 根据 大 数据 预测 为 客户 提前 提供 有 效 服务 ， 改 善 客户 体验 ， 同 时 增加 商业 
机 会 。 

2) ”需求 分 析 和 产品 创新 

银行 可 以 从 职业 、 年 龄 、 收 入 、 居 住地 、 习 惯 爱 好 、 资 产 、 信 用 等 各 个 方面 对 客户 进 
行 分 类 ， 依 据 其 他 的 数据 输入 维度 来 确定 客户 的 需求 并 定制 产品 。 银 行 还 可 以 依据 企业 的 
交易 数据 来 预测 行业 发 展 特点 ， 为 企业 客户 提供 金融 产品 服务 。 保 险 行业 可 以 依据 外 部 数 
据 导 入 ， 根 据 热 点 词汇 来 判断 市 场 对 保险 产品 的 需要 。 证 券 公司 也 可 以 依据 外 部 数据 判读 
投资 者 喜好 ， 来 定制 投资 产品 ， 进 行 产 品 创新 。 

3. 运营 

1) ”提升 运营 效率 

大 数据 可 以 展现 不 同 产 品 线 的 实际 收入 和 成 本 ， 帮 助 银行 进行 产品 管理 。 同 时 ， 大 数 
据 为 管理 层 提供 全 方面 的 报表 ， 揭 示 内 部 运营 管理 效率 ， 有 利于 内 部 效率 提升 。 大 数据 可 
以 帮助 市 场 部 门 有 效 监 测 营销 方案 和 市 场 推广 情况 ， 提 高 营销 精度 ， 降 低 营 销 费用 。 大 数 
据 可 以 通过 展现 风险 视图 来 控制 信用 风险 ， 同 时 加 快 信用 审批 。 大 数据 可 以 帮助 保险 行业 
快速 为 客户 提供 保险 方案 ， 提 高 效率 ， 降 低 成 本 。 证 券 行 业 也 可 以 利用 大 数据 动态 提供 行 
业 报 告 ， 快 速 帮助 投资 人 。 

2) ”决策 支持 

大 数据 可 以 帮助 金融 企业 ， 为 即将 实施 的 决策 提供 数据 支撑 ， 同 时 也 可 以 依据 大 数据 
分 析 归 纳 出 规律 ， 进 一 步 演绎 出 新 的 决策 。 基 于 大 数据 和 人 工 智 能 技术 的 决策 树 模型 将 会 
有 效 帮 助 金融 行业 分 析 信用 风险 ， 为 业务 决策 提供 有 力 支持 。 金 融 行 业 新 产品 或 新 服务 推 
向 市 场 前 ， 可 以 在 局 部 地 区 进行 试验 ， 大 数据 技术 可 以 对 采集 的 数据 进行 分 析 ， 通 过 统计 
分 析 报 告 为 新 产品 的 市 场 推广 提供 决策 支持 。 

4. 风 控 (风险 控制 ) 

1) “信用 风险 评估 

银行 可 以 利用 大 数据 增加 信用 风险 输入 维度 ， 提 高 信用 风险 管理 水 平 ， 动 态 管理 企业 
和 个 人 客户 的 信用 风险 。 建 立 基于 大 数据 的 信用 风险 评估 模型 和 方法 ， 将 会 提高 银行 对 中 
小 企业 和 个 人 的 资金 支持 。 个 人 信用 评分 标准 的 建立 ， 将 会 帮助 银行 在 即将 到 来 的 信用 消 
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费时 代 取 得 领先 地 位 。 基 于 大 数据 的 动态 的 信用 风险 管理 机 制 ， 将 会 帮助 银行 提前 预测 高 
风险 信用 违约 时 间 ， 及 时 介入 ， 降 低 违约 概率 ， 同 时 预防 信用 欺诈 。 

2) ”欺诈 风险 管理 

信用 卡 公司 可 以 利用 大 数据 及 时 预测 和 发 现 恶意 欺诈 事件 ， 及 时 采取 措施 ， 降 低 信 用 
欺诈 风险 。 保 险 公司 可 以 利用 大 数据 发 现 恶 意 投 保 和 索赔 事件 ， 降 低 欺 诈 带 来 的 经 济 损 
失 。 银 行 可 以 基于 大 数据 建立 防 欺诈 监控 系统 ， 动 态 管 理 网 上 银行 、POS、ATM 等 渠道 的 
欺诈 事件 。 大 数据 提供 了 多 维度 的 监控 指标 和 联动 方式 ， 可 以 弥补 和 完善 目前 反 欺 诈 监 控 
方式 的 不 足 。 特 别 在 识别 客户 行为 趋势 方面 ， 大 数据 具有 较 大 的 优势 。 

金融 行业 的 数据 丰富 ， 通 过 对 客户 信息 、 交 易 信 息 、 资 产 信 息 、 信 用 信息 等 数据 的 采 
集 和 整理 ， 结 合 外 部 数据 分 析 ， 可 以 有 效 帮 助 金融 行业 进行 精准 营销 、 提 高 运营 效率 、 优 
化 客户 服务 、 进 行 产 品 创新 、 提 高 信用 风险 和 欺诈 风险 管理 水 平 ， 为 决策 提供 有 效 支 持 。 
但 在 大 数据 时 代 ， 人 金融 行业 也 面临 着 诸如 自身 技术 、 信 息 安 全 、 金 融 监管 等 方面 的 挑战 ， 
相信 随 着 大 数据 技术 的 发 展 ， 这 些 问 题 会 逐步 得 到 解决 。 
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1.3.1 大 数据 金融 的 内 涵 


大 数据 金融 是 指 运 用 大 数据 技术 和 大 数据 平台 开展 金融 活动 和 金融 服务 ， 对 金融 行业 
积累 的 大 数据 以 及 外 部 数据 进行 云 计算 等 信息 化 处 理 ， 结 合 传统 金融 ， 开 展 资金 融通 、 创 
新 金融 服务 。 具 体 来 说 ， 大 数据 金融 通过 收集 和 整合 海量 的 非 结构 化 数据 ， 运 用 大 数据 、 
互联 网 、 云 计算 等 信息 化 方式 ， 对 客户 消费 数据 进行 实时 分 析 ， 可 以 为 金融 企业 提供 客户 
全 方位 信息 ， 通过 分 析 和 挖掘 客户 的 交易 和 消费 信息 掌握 客户 的 消费 习惯 ， 准 确 预测 客户 

行为 ， 提 高 金融 服务 平台 新 的 效率 以 及 降低 信贷 风险 。 

金融 行业 的 大 数据 大 致 分 为 以 下 3 类 。 

(1) 传统 的 结构 化 数据 ， 如 各 种 数据 库 和 文件 信息 等 。 

(2) 社交 媒体 为 代表 的 过 程 数据 ， 涵 盖 了 用 户 偏好 、 习 惯 、 特 点 、 发 表 的 评论 ， 朋 友 
圈 之 问 的 关系 等 。 

(3) 日 益 增 长 的 机 器 设备 以 及 传感器 所 产生 的 数据 ， 如 柜 面 监控 视频 、 呼 叫 中 心 语 
音 、 手 机 、ATM 等 记录 的 位 置信 息 等 。 

根据 金融 行业 的 分 类 ， 可 以 将 大 数据 金融 细 分 为 大 数据 银行 、 大 数据 保险 和 大 数据 证 
券 。 差 异化 车 险 定价 是 典型 的 大 数据 保险 形式 之 一 ， 是 指 保险 行业 利用 驾驶 信息 来 确定 车 
险 价格 ， 良 好 驾驶 习惯 的 车 主 ， 其 车 险 价格 就 较 低 ， 反 之 车 险 价格 就 较 高 ， 信 用 卡 自动 授 
信和 是 典型 的 大 数据 银行 的 应 用 ， 银 行 根据 用 卡 客户 数据 确定 是 否 授信 以 及 计算 信用 额度 ; 
机 器 人 投资 是 大 数据 证 券 的 创新 模式 之 一 ， 证 券 公司 根据 股价 的 影响 因素 建立 模型 ， 自 动 
选择 股票 8 或 寻找 交易 时 机 ， 在 适当 的 风 控 模型 下 建立 机 器 人 投资 去 交易 模式 。 
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1.3.2 大 数据 金融 的 特点 

大 数据 金融 与 传统 金融 相 比 ， 存 在 如 下 几 个 方面 的 特点 。 

1. 呈现 方式 网 络 化 

在 大 数据 金融 时 代 ， 大 量 的 金融 产品 和 服务 通过 网 络 呈现 ， 如 支付 结算 、 网 络 借贷 、 
P2P、 众 筹 融资 、 资 产 管理 、 现 金管 理 、 产 品 销售 、 金 融 咨询 等 都 将 主要 通过 网 络 实现 。 
网 络 也 包括 固定 网 络 和 移动 网 络 ， 其 中 移动 网 络 将 逐步 成 为 大 数据 金融 服务 的 主要 途径 。 

2. 风险 管理 有 所 调整 

在 风险 管理 理念 上 ， 财 务 分 析 (第 一 还 款 来 源 )、 可 抵押 财产 或 其 他 保证 (第 二 还 款 来 源 ) 
重要 性 将 有 所 降低 。 交 易 行为 的 真实 性 、 信 用 的 可 信 度 通过 数据 的 呈现 方式 将 会 更 加 重 
要 ， 风 险 定价 方式 将 会 出 现 革命 性 变化 。 对 客户 的 评价 将 是 全 方位 、 立 体 的、 活生生 的 ， 
而 不 再 是 一 个 抽象 的 、 模 糊 的 客户 构图 。 基 于 数据 挖 气 的 客户 识别 和 分 类 将 成 为 风险 管理 
的 主要 手段 ， 动 态 、 实 时 的 监测 而 非 事后 的 回顾 式 评价 将 成 为 风险 管理 的 常态 性 内 容 。 

3. 信息 不 对 称 性 降低 

在 大 数据 金融 时 代 ， 金 融 产 品 和 服务 的 消费 者 和 提供 者 之 间 的 信息 不 对 称 程度 会 大 大 
降低 。 对 某 项 金融 产品 (服务 ) 的 支持 和 评价 ， 消 费 者 也 可 实时 获知 。 

4. 金融 业务 效率 提高 

大 数据 金融 的 许多 流程 和 动作 都 是 在 线 上 发 起 和 完成 的 ， 有 些 动作 是 自动 实现 的 。 在 
合适 的 时 间 、 合 适 的 地 点 ， 把 合适 的 产品 以 合适 的 方式 提供 给 合适 的 消费 者 。 同 时 ， 强 大 
的 数据 分 析 能 力 可 以 将 金融 业务 做 到 极 高 的 效率 ， 交 易 成 本 也 会 大 幅 降低 。 

5. 金融 企业 服务 边界 扩大 

首先 ， 对 于 单个 金融 企业 ， 最 适合 扩大 经 营 规模 ， 由 于 效率 提升 ， 其 经 营 成 本 必然 随 
之 下 降 。 金 融 企业 的 成 本 曲线 形态 也 会 发 生变 化 ， 长 期 平均 成 本 曲线 的 底部 会 更 快 来 临 
也 会 更 平坦 、 更 宽 。 其 次 ， 基 于 大 数据 技术 ， 金 融 从 业 人 员 个 体 服务 对 象 会 更 多 ， 即 单个 
金融 企业 从 业 人 员 会 有 减少 的 趋势 ， 或 至 少 其 市 场 人 员 有 降低 的 趋势。 

6. 产品 是 可 控 的 、 可 接受 的 

通过 网 络 化 呈现 的 金融 产品 ， 对 消费 者 而 言 ， 是 可 控 、 可 接受 的 。 产 品 可 控 是 指 在 消 
费 者 看 来 ， 其 风险 是 可 控 的 。 产 品 可 接受 是 指 在 消费 者 看 来 ， 首 先 其 收益 或 成 本 是 可 以 接 
受 的 ， 其次， 产品 的 流动 性 是 可 以 接受 的 ， 最 后 ， 基 于 金融 市 场 的 数据 信息 ， 消 费 者 认为 
其 产品 也 是 可 以 接受 的 。 

7. 普 惠 金融 

大 数据 金融 的 高 效率 性 及 扩展 的 服务 边界 ， 使 金融 服务 的 对 象 和 范围 也 大 大 扩展 ， 金 
融 服务 也 更 接地 气 。 例 如 ， 极 小 金额 的 理财 服务 、 存 款 服务 、 支 付 结算 服务 等 普通 老百姓 
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都 可 以 享受 到 ， 甚 至 极 小 金额 的 融资 服务 也 会 普遍 发 展 起 来 ， 金 融 深化 在 大 数据 金融 时 代 
可 以 完全 实现 。 


1.3.3 ”大 数据 金融 相对 于 传统 金融 的 优势 


传统 金融 对 数据 的 重视 程度 不 高 ， 数 据 分 析 技 术 落 后 ， 大 数据 技术 的 应 用 相对 缺乏 。 
相 比 传统 金融 ， 大 数据 金融 具有 如 下 优势 。 

1. 放贷 快捷 ， 精 准 营销 个 性 化 服务 

大 数据 金融 建立 在 长 期 的 大 量 的 信用 及 资金 流 的 大 数据 基础 之 上 ， 在 任何 时 点 都 可 以 
通过 计算 得 出 信用 评分 ， 并 采用 网 上 支付 方式 ， 实 时 根据 贷款 需要 及 其 信用 评分 等 数据 进 
行 放贷 。 大 数据 金融 根据 企业 不 同 的 生产 流程 和 信用 评分 进行 放贷 ， 不 受 时 空 限制 ， 较 好 
地 匹配 了 企业 的 期 限 管理 ， 解 决 了 企业 的 流动 性 问题 。 此 外 ， 大 数据 金融 还 可 以 针对 每 一 
家 企业 的 个 性 化 融资 需求 做 出 不 同 的 金融 服务 且 快 速 、 准 确 、 高 效 。 

2. 客户 群体 大 ， 运 营 成 本 低 


传统 金融 主要 是 以 人 工 为 主体 参与 审批 ， 大 数据 金融 是 以 大 数据 云 计 算 为 基础 ， 以 大 
数据 自动 计算 为 主 ， 不 需要 大 量 人 工 ， 成 本 较 低 ， 不 仅 可 以 针对 小 微 企业 提供 金融 服务 ， 
还 可 以 根据 企业 生产 周期 灵活 调整 贷款 期 限 。 大 数据 金融 整合 了 碎片 化 的 需求 和 供给 ， 将 
服务 领域 拓展 至 更 多 的 中 小 企业 和 中 小 客户 ， 更 大 程度 地 降低 了 大 数据 金融 的 运营 成 本 和 
交易 成 本 。 


3. 科学 决策 ， 有 效 风 控 


网 络 借贷 平台 或 供应 链 聚 集 了 信息 流 、 物 流 和 资金 流 ， 其 借贷 信息 都 累积 在 大 数据 金 
融 库 持久 闭环 的 产业 上 下 游 内 部 ， 贷 款 方 对 产业 运作 和 风险 点 比较 熟悉 且 容 易 掌 控 ， 有 利 
于 风险 的 防范 和 预警 。 大 数据 金融 可 以 根据 这 些 交 易 借贷 行为 的 违约 率 等 相关 指标 估计 信 
用 评分 ， 运 用 分 布 式 计算 做 出 风险 评估 模型 ， 解 决 信用 分 配 、 风 险 评估 、 授 权 实 施 以 及 欺 
诈 识别 等 问题 。 通 过 以 大 数据 金融 为 基础 的 风 控 科 学 决策 ， 有 效 地 降低 了 不 良 贷款 率 。 

大 数据 金融 相 比 于 传统 金融 有 无 可 比拟 的 优势 。 企 业 可 以 通过 大 数据 金融 对 商业 模式 
和 一 利 模式 加 以 创新 ， 获 得 在 产业 链 中 的 核心 地 位 。 大 数据 金融 带 来 的 技术 革新 和 金融 创 
新 不 仅 能 支持 中 小 企业 的 发 展 ， 还 能 促进 我 国 经 济 结构 调整 和 转型 升级 。 因 此 ， 大 数据 金 
融 战略 是 企业 和 国家 的 战略 选择 。 


(@J 生 9 大 数据 带 来 金融 业 大 变革 


随 着 计算 机 技术 和 互联 网 的 发 展 ， 金 融 行 业 的 数据 采集 能 力 逐 步 提 高 ， 存 储 了 大 量 时 
间 连 续 、 动 态 变化 的 金融 数据 。 相 比 于 其 他 行业 ， 大 数据 对 金融 业 更 具有 潜在 价值 。 麦 肯 
锡 的 研究 表明 ， 金 融 业 在 大 数据 价值 潜力 指数 中 排名 第 一 。 伴 随 着 大 数据 的 应 用 、 技 术 革 
新 以 及 商业 模式 的 创新 ， 金 融 交 易 形式 日 趋 电子 化 和 数字 化 ， 具 体 表 现 为 支付 电子 化 、 渠 
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道 网 络 化 、 信 用 数字 化 ， 运 营 效 率 得 到 极 大 提升 。 银 行 、 保 险 、 证 券 等 传统 金融 行业 迎 来 
了 巨大 的 变革 。 


1.4.1 大 数据 带 来 银行 业 大 变革 


近 几 年 ， 大 数据 高 速 发 展 ， 使 得 银行 业 的 客户 数据 、 交 易 数据 、 管 理 数据 等 均 呈 现 烛 
炸 式 增长 。 据 中 国 银联 公开 数据 显示 ， 全 国 仅 “ 银 联 ”银行 卡 的 发 行 量 目前 就 接近 40 亿 
张 ， 每 天 有 近 600 亿 元 的 交易 通过 银联 的 银行 卡 进行 。 如 果 再 加 上 开户 信息 数据 、 银 行 网 
点 和 在 线 交易 的 各 种 数据 ， 以 及 金融 系统 自身 运营 的 数据 ， 目 前 国内 银行 每 年 上 升 的 数据 
能 达到 数 十 PB。 数 据 海量 增长 为 银行 业 带 来 了 机 遇 和 挑战 ， 其 服务 与 管理 模式 已 逐步 发 
生 改 变 。 

1. 电子 商务 平台 和 电子 银行 


2012 年 开始 ， 多 家 商业 银行 开设 了 自己 的 电子 商务 平台 ， 其 中 以 建设 银行 、 中 国 银 
行 、 交 通 银行 的 规模 最 大 。 这 些 购物 网 站 与 其 他 电 商 并 没有 太 大 的 差别 ， 包 括 吃 穿 住 行 等 
方面 。 另 外 ， 还 有 一 些 商业 银行 使 用 其 他 途径 参与 电 商 。 商 业 银 行 挑战 电 商 市 场 ， 其 目的 
并 不 在 于 网 上 商城 的 营业 收入 ， 而 在 于 扩展 客户 数据 ， 使 客户 数据 立体 化 ， 以 了 解 客 户 消 
费 习 惯 、 消 费 能 力 、 兴 趣 数据 、 风 险 偏好 等 进行 客户 画像 的 构建 ， 预 测 客户 行为 ， 进 行 差 
异化 服务 。 

银行 大 力 投 资 改 革 网 上 银行 业务 。 相 比 阿 里 巴巴 、 腾 讯 等 跨 界 者 ， 银 行 在 资金 、 风 险 
管理 能 力 、 人 才 储 备 等 方面 具备 优势 。 国 内 多 家 银行 大 力 投资 于 网 上 平台 、 推 出 网 上 服 
务 ， 进 行 多 元 化 创新 ， 为 发 展 自 有 互联 网 金融 业务 贡 定 基础 。 目 前 ， 商 业 银行 的 网 上 服务 
包括 传统 银行 业务 、 电 子 商务 与 移动 支付 ， 以 及 P2P 等 新 兴业 务 等 。 


2. 客户 个 性 营销 


随 着 利率 市 场 化 和 民营 银行 设立 预期 的 加 剧 以 及 互联 网 金融 的 兴起 ， 银 行业 竞争 日 益 
激烈 ， 利 差 进一步 缩 窗 ， 银 行 纷 纷 进行 发 展 模式 的 战略 转型 。 实 现 战略 转型 目标 要 求 银行 
必须 可 靠 、 实 时 掌握 客户 的 真实 需求 ， 全 面 完整 描 述 客户 的 真实 面貌 。 大 数据 的 发 展 为 上 
述 需求 提供 了 技术 条 件 ， 通 过 广泛 收集 各 渠道 、 各 类 型 的 数据 ， 使 用 大 数据 技术 整合 各 类 
信息 、 还 原 客户 真实 面 狐 ， 可 以 帮助 银行 切实 掌握 客户 的 真实 需求 ， 并 根据 客户 需求 做 出 
快速 应 对 ， 实 现 精 准 营销 和 个 性 化 服务 。 例 如 ， 新 加 坡 花旗 银行 根据 客户 的 刷卡 时 间 和 地 
点 ， 结 合 客户 的 购物 、 餐 饮 习 惯 等 个 人 虚拟 性 ， 可 以 精确 地 向 客户 推荐 商场 及 餐厅 优惠 
信息 。 

3. 银行 风险 管理 

风险 管理 是 银行 的 生命 线 。 以 往 银行 在 进行 信用 风险 管理 时 ， 主 要 依据 客户 的 会 计 信 
息 、 客 户 经 理 的 调查 、 客 户 的 信用 记录 以 及 客户 抵押 担保 情况 等 ， 通 过 专家 判断 进行 决 
策 。 大 数据 技术 的 应 用 使 银行 的 风险 管理 能 力 大 幅 提高 。 一 方面 ， 通 过 多 种 传感器 、 多 个 
渠道 采集 数据 ， 使 银行 更 全 面 、 更 真实 、 更 准确 、 更 实时 地 掌握 借款 人 的 信息 ， 有 效 降 低 
信息 不 对 称 带 来 的 风险 。 另 一 方面 ， 利 用 大 数据 技术 可 以 找到 不 同 变量 之 间 的 关联 关系 ， 
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形成 新 的 决策 模型 ， 使 决策 更 加 准确 、 统 一 和 合理 。 银 行 利用 大 数据 能 够 创新 风险 决策 模 
式 ， 赢 得 新 客户 ， 形 成 利润 增长 点 。 如 图 1.11 所 示 是 大 数据 风险 管理 的 基本 步骤 。 


准备 阶段 数据 资料 数据 结 应 用 阶段 


“业务 理解 * 个 人 基本 信息 。 。 基 于 不 同 的 风 。。 信 用 评级 “辅助 决策 
* 数 据 理解 。 银 行 账户 信息 控 模 型 。 身 份 验证 
“数据 准备 “银行 流水 信息 “数据 控 气 与 次 诈 监控 

“机关 的 本 联网 


图 1.11 大 数据 风险 管理 的 基本 步骤 


1.4.2 大 数据 带 来 保险 业 大 变革 


大 数据 与 保险 业 具 有 天 然 的 关联 性 。 保 险 经 营 的 核心 基础 是 大 数 法 则 ， 如 保险 生命 表 
就 是 以 十 万 人 为 组 来 进行 测算 。 无 论 是 财产 保险 的 概率 事件 ， 还 是 寿险 的 概率 生命 期 ， 都 
是 由 大 量 数 据 分 析 获 得 的 规律 。 长 期 以 来 ， 保 险 业 通过 上 门 、 柜 面 、 信 函 、 电 话 、 短 信 、 
微 信 等 多 种 方式 ， 已 经 积累 了 大 量 的 客户 交互 数据 。 近 年 来 兴起 的 互联 网 保险 也 成 为 保险 
业 收 集 数据 的 新 平台 。 据 统计 ， 国 内 大 型 保险 公司 每 年 新 增 的 数据 量 达 到 PB 级 。 在 全 球 
保险 大 数据 应 用 市 场 中 ， 主 要 领域 包括 客户 行为 分 析 、 承 保定 价 、 互 联网 数据 分 析 、 市 场 
渠道 分 析 、 风 险 建 模 、 预 测 分 析 、 商 业 决 策 、 欺 诈 侦 测 等 。 


1. 承保 定价 


在 大 数 法 则 下 ， 保 险 产品 的 定价 主要 是 基于 样本 数据 的 分 析 。 大 数据 时 代 ， 保 险 定 价 
是 基于 社会 和 全 体 数据 ， 不 仅 包括 保险 公司 存储 的 客户 数据 ， 还 包括 整个 互联 网 上 的 数 
据 ， 如 来 自 社 交 网 络 上 的 文字 、 图 片 或 者 视频 信息 。 这 将 颠覆 传统 保险 精算 的 理论 和 技 
术 ， 推 动 保险 商业 模式 的 革命 性 和 突破 性 创新 。 车 险 将 采用 差别 定价 模式 ， 生 命 表 也 将 发 
生 更 新 换代 式 的 变革 ， 所 有 的 投保 人 将 获得 一 个 公平 的 保险 价格 。 例 如 ， 保 险 公司 可 以 通 
过 数据 分 析 ， 掌 握 客户 车 辆 主要 用 途 、 基 本 行车 路 线 、 路 途 的 风险 程度 、 驾 驶 习惯 等 风险 
状况 ， 以 此 评估 客户 车 辆 的 风险 指数 ， 进 而 制定 差别 费 率 ， 对 于 风险 低 的 客户 降低 费 率 ， 
对 于 风险 高 的 客户 提高 费 率 甚至 拒绝 承保 。 

2. 精准 营销 

传统 的 广告 宣传 手段 是 采用 传统 媒体 ， 如 电视 、 广 告 牌 等 ， 每 个 用 户 看 到 的 广告 一 
样 ， 若 该 用 户 没有 相关 需求 ， 广 告 也 就 没有 效果 。 大 数据 时 代 的 保险 营销 不 是 针对 所 有 和 群 
体 的 一 个 广告 及 营销 手段 ， 而 是 实施 精准 营销 。 精 准 营销 是 通过 分 析 客 户 行为 ， 制 定 相应 
的 销售 与 服务 策略 ， 把 合适 的 产品 或 服务 ， 以 合适 的 价格 ， 在 合适 的 时 间 ， 通 过 合适 的 渠 
道 ， 提 供给 合适 的 客户 。 大 数据 技术 的 应 用 ， 可 以 帮助 保险 公司 完成 寻找 目标 客户 、 挖 掘 
客户 潜在 保险 需求 等 任务 。 大 数据 营销 使 保险 公司 的 客户 营销 策略 更 为 精确 直接 ， 避 免 以 
往常 见 的 逐 户 、 陌 生 拜 访 、 陪 同 拜 访 现象 ， 也 避免 了 和 同业 竞争 对 手 直接 碰撞 。 相 比 开拓 
新 客户 ， 大 数据 营销 对 原 有 客户 购买 力 的 深度 挖掘 和 忠诚 度 培养 具有 重要 意义 。 
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国内 友邦 保险 开通 了 网 上 服务 自助 平台 及 微 信服 务 平台 ， 开 发 客户 地 图 等 系统 工具 ， 
帮助 销售 人 员 科 学 管理 和 分 析 客 户 在 不 同人 生 阶 段 的 保障 、 理 财 需 求 。 试 验 的 02O 模 
式 ， 已 经 初 见 成 效 。 线 上 的 精准 定位 和 前 期 需求 的 挖掘 ， 与 线 下 高 效 的 销售 流程 相 结 合 ， 
有 效 提升 了 客户 转化 率 ， 也 为 企业 创造 了 价值 。 


3. 欺诈 识别 


保险 欺诈 ， 尤 其 是 健康 保险 领域 的 欺诈 ， 具 有 专业 性 、 隐 项 性 等 特点 。 保 险 公司 主 要 
是 依靠 一 些 固定 标准 和 列 配 人 员 的 经 验 ， 来 判断 是 否 存在 保险 欺诈 。 由 于 缺乏 行业 内 协作 
机 制 和 共享 的 信息 平台 ， 调 查 的 质量 主要 是 依赖 于 理赔 人 员 的 个 人 素质 以 及 公安 机 关 的 合 
作 情 况 。 从 本 质 上 看 ， 其 诈 是 由 双方 信息 不 对 称 所 导致 的 ， 大 数据 能 够 弱化 部 分 不 对 称 的 
信息 ， 建 立 高 效 的 反 欺诈 鉴别 机 制 。 

为 了 防范 健康 保险 交易 中 诈骗 的 发 生 ， 美 国 各 州 在 建立 全 民 医 疗 保险 的 网 络 销售 平台 
时 ， 附 加 建立 专业 软件 平台 ， 用 于 自动 识别 和 侦破 可 疑 的 健康 保险 索赔 数据 。 在 国内 ， 全 
国 各 地 保险 公司 正在 积极 建设 客户 理赔 信息 即时 共享 机 制 、 完 善 统一 的 欺诈 风险 信息 库 ， 
以 及 广泛 的 异地 协查 网 络 ， 积 极 实现 商业 保险 与 社会 保险 之 间 的 实时 对 接 ， 扩 大 共享 范 
围 ， 提 高 支撑 识别 保险 欺诈 的 数据 质量 。 


1.4.3 ”大 数据 带 来 证 券 业 大 变革 


随 着 A 股市 场 全 面 放 开 一 人 一 户 限 制 、 证 券 经 营 牌照 将 会 向 互联 网 公司 放 开 ， 面 对 居 
民 财 富 迅速 增长 和 其 对 理财 产品 多 样 化 的 需求 ， 证 券 公司 受到 来 自行 业内 外 部 的 双重 压 
力 ， 当 前 它们 正在 进行 业务 转型 。 传 统 IT 基础 设施 环境 已 经 无 法 满足 证 券 公司 对 转型 和 
创新 战略 的 要 求 。 随 着 大 数据 时 代 的 到 来 ， 对 于 证 券 公司 ， 数 据 驱 动 的 创新 平台 的 建设 为 
即将 到 来 的 业务 差异 化 竞争 提供 了 强 有 力 的 技术 支持 。 相 比 于 银行 业 和 保险 业 ， 证 券 行业 
的 大 数据 应 用 相对 较 晚 ， 正 处 于 起 步 阶段 ， 目 前 大 数据 主要 应 用 于 个 性 化 服务 、 量 化 投资 
和 股价 预测 。 


1. 个 性 化 服务 


券商 作为 金融 中 介 的 职能 在 信息 技术 的 冲击 下 将 有 所 改变 。 在 大 数据 背景 下 ， 券 商 将 
有 能 力 快速 收集 、 传 导 大 量 的 高 质量 信息 ， 以 设计 出 符合 客户 需求 的 产品 组 合 ， 并 不 断根 
据 客户 偏好 的 改变 而 调整 。 同 时 ， 通 道中 介 服 务 深 陷 同 质 竞争 ， 争 夺 焦 点 必然 落 到 价格 
上 。 但 是 如 果 标准 化 同 质 服务 不 再 能 够 给 券商 带 来 正常 利润 ， 最 优选 择 要 么 是 从 竞争 中 彻 
底 退 出 ， 要 么 是 转变 经 营 思路 ， 将 通道 业务 转变 成 包含 增值 服务 的 金融 服务 。 

大 数据 在 加 强风 险 管控 、 精 细 化 管理 、 服 务 创新 等 转型 中 别 具 现 实意 义 ， 是 实现 向 信 
息 化 券商 转型 的 重要 推动 力 。 首 先 ， 大 数据 能 够 加 强风 险 的 可 审 性 和 管理 力度 。 其 次 ， 大 
数据 能 够 支持 精细 化 管理 。 当 前 ， 中 国 证 券 业 以 客户 为 中 心 的 管理 改革 已 经 起 步 ， 必 人 然 会 
对 券商 提出 精细 化 管理 的 新 要 求 。 再 次 ， 大 数据 支持 服务 创新 ， 能 够 更 好 地 实现 “以 客户 
为 中 心 ”理念 ， 通 过 对 客户 消费 行为 模式 进行 分 析 ， 提 高 客户 转化 率 ， 开 发 出 不 同 的 产品 
以 满足 不 同 客户 的 市 场 需求 ， 实 现 差异 化 竞争 。 


23 


me 


在 过 去 的 10 年 里 ， 越 来 越 多 的 证 券 公司 采用 数据 驱动 的 方法 进行 有 针对 性 的 服务 来 
降低 风险 和 提高 业绩 。 通 过 执行 特殊 的 数据 分 析 程 序 来 对 一 系列 资料 进行 收集 、 存 储 、 管 
理 和 分 析 大 数据 集 ， 识 别 关 键 业务 ， 以 便 给 客户 提供 更 好 的 决策 。 可 利用 的 金融 数据 源 包 
括 股票 价格 、 外 汇 和 衍生 品 交易 、 交 易 记 录 、 高 频 交 易 、 无 结构 化 新 闻 和 文本 以 及 隐 含 在 
社会 媒体 和 网 络 中 的 消费 者 信心 和 商业 情绪 。 

2. 量化 投资 

随 着 互联 网 的 发 展 ， 证 券 行业 已 经 进入 一 个 大 数据 信息 海洋 的 云 时 代 。“ 光 大 证 券 乌 
龙 事件 ”也 彻底 表明 了 在 一 般 投 资 者 面 对 操 盘 的 是 冰冷 的 电脑 方程 式 ， 证 券 的 数据 模型 更 
加 复杂 多 样 ， 数 据 的 总 量 和 种 类 都 有 着 非常 大 的 突破 。“ 光 大 黑 天 鹅 事件 ”或 许 只 是 A 股 
市 场 此 类 事件 的 开始 ， 因 而 针对 此 类 事件 的 预警 变 得 格外 重要 。 大 数据 技术 是 预防 “ 黑 天 
鹅 ” 的 重要 手段 。 大 数据 在 处 理 证券 数 据 时 能 加 深 对 数据 本 身 ， 主 力 资金 和 散户 资金 ， 以 
及 散户 和 主力 的 行为 、 轨 迹 ， 主 力 和 散户 之 间 、 主 力 和 市 场 之 间 的 关系 、 散 户 和 市 场 之 间 
的 关系 等 多 重 关系 的 理解 。 如 果 能 把 这 些 数据 使 用 好 ， 包 括 数据 、 数 据 挖掘 能 力 、 算 法 、 
平台 等 ， 就 能 够 很 好 地 增加 投资 胜率 。 量 化 投资 策略 在 欧美 等 发 达 国家 的 金融 市 场 发 展 已 
经 相对 成 熟 ， 行 业 竞争 越 来 越 激烈 。 

量化 投资 由 于 其 巨大 收益 ， 是 大 数据 最 早 应 用 的 领域 ， 而 其 也 符合 大 数据 最 重要 的 三 
大 思维 变革 。 随 着 互联 网 和 移动 互联 网 带 来 的 信息 化 革命 ， 个 人 投资 者 将 能 够 轻松 使 用 大 
数据 获得 实证 支持 ， 降 低 交 易 策 略 风险 ， 投 资 能 力 将 大 幅 提升 。 大 数据 让 科技 公司 第 一 次 
有 机 会 能 够 挑战 传统 的 金融 分 析 师 和 交易 员 ， 利 用 对 各 种 全 体 数 据 的 量化 、 重 组 和 整合 ， 
低 成 本 地 建立 针对 各 个 市 场 、 面 向 不 同 用 户 的 交易 策略 ， 让 投资 者 能 够 科学 稳定 地 在 全 球 
市 场 投资 。 因 此 ， 大 数据 时 代 对 金融 投资 的 革命 不 仅仅 是 未 来 的 趋势 ， 而 是 正在 实现 的 现 
实 ， 谁 能 做 到 这 一 点 ， 谁 就 能 引领 证 券 投资 的 未 来 。 


3. 股价 预测 


传统 的 股票 价格 预测 是 利用 股票 形态 分 析 理 论 对 股票 未 来 走势 的 方向 和 可 能 性 做 出 预 
测 ， 这 种 方法 是 从 海量 的 历史 数据 中 寻找 和 某 只 股票 当前 趋势 相同 或 相似 的 趋势 ， 并 根据 
历史 趋势 判断 未 来 股票 价格 。 股 市 是 个 复杂 的 系统 ， 仅 仅 根据 历史 数据 进行 预测 比较 片 
面 ， 不 一 定 准确 。 在 大 数据 时 代 ， 通 过 网 络 产生 的 搜索 数据 、 互 动 数据 等 也 可 以 用 来 预测 
股市 活跃 度 和 股价 走势 变化 。 互 动 数 据 反 映 了 投资 者 对 某 只 特定 股票 的 喜好 与 厌恶 ， 可 以 
简单 描述 为 对 股票 的 操作 是 持 有 还 是 卖 出 ;搜索 数据 则 代表 投资 者 对 某 只 股票 的 兴趣 和 关 
注 点 ， 关 注 度 高 意味 着 消息 的 影响 力 大 。 市 场 本 身 带 有 主观 判断 因素 ， 投 资 者 的 情绪 会 影 
响 投资 行为 ， 而 投资 行为 直接 影响 资产 价格 。 例 如 ， 英 国 对 冲 基金 Derwent Capital 
Markets) 是 基于 社交 网 络 建立 的 对 冲 基金 ， 该 基金 通过 分 析 Twitter 上 的 数据 内 容 感知 市 场 
情绪 ， 依 据 对 市 场 情绪 数据 的 分 析 进 行 股价 预测 ， 进 而 指导 投资 者 投资 。 此 外 ，IBM 使 用 
大 数据 信息 技术 成 功 开发 了 经 济 指标 预测 系统 。 借 助 该 预测 系统 ， 可 通过 统计 分 析 新 闻 中 
出 现 的 单词 等 信息 来 预测 股价 等 走势 。 这 种 经 济 指标 预测 系统 首先 从 互联 网 上 的 新 闻 中 搜 
索 与 “新 订单 ”等 与 经 济 指标 有 关 的 单词 ， 然 后 结合 其 他 相关 经 济 数据 的 历史 数据 分 析 与 
股价 的 关系 ， 从 而 得 出 预测 结果 。 
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1.4.4 大 数据 带 来 征 信 行业 大 变革 


传统 征 信 包括 线 下 的 金融 征 信 体 系 、 社 会 征 信 体系 、 商 业 征 信 体 系 以 及 线 上 某 一 层级 
数据 的 单一 分 析 的 IT 征 信 。 而 大 数据 征 信 数 据 来 源 更 广泛 ， 不 仅 包括 上 述 征 信 体系 ， 还 
包括 利用 互联 网 手段 工具 挖掘 的 电子 商务 、 社 交 、 网 络 行为 等 特征 信息 。 随 着 社会 经 济 的 
飞速 发 展 ， 征 信 业 所 收集 、 存 储 、 处 理 的 信息 数据 量 呈 现 爆炸 式 增长 ， 其 必然 也 会 进入 大 
数据 时 代 。 在 大 数据 时 代 ， 大 数据 思想 和 技术 以 其 自身 的 优势 必 将 为 征 信 业 提供 新 的 发 展 
机 遇 ， 为 征 信 数据 、 征 信服 务 、 数 据 采 集 、 征 信 产 品 等 带 来 一 系列 变革 。 

1. 征 信 数 据 


大 数据 时 代 的 到 来 使 得 征 信 数据 来 源 更 为 广泛 ， 征 信 数 据 类 型 更 为 多 样 。 在 数据 来 源 
上 ， 传 统 的 征 信 数 据 主要 来 源 于 个 人 或 者 机 构 的 借贷 、 冉 购 、 担 保 、 租 赁 、 保 险 、 信 用 卡 
等 活动 ， 这 些 活动 中 产生 的 行政 处 罚 信息 、 缴 纳 各 类 社保 和 公共 事业 费用 信息 等 都 是 征 信 
数据 。 在 大 数据 时 代 ， 征 信 数 据 更 多 的 是 来 源 于 线 上 ， 互 联网 公司 (如 淘宝 、 京 东 等 ) 通 过 
客户 网 上 的 交易 记录 、 评 价 等 信息 还 有 社交 网 络 信息 更 加 真实 完整 地 了 解 客户 的 信用 状 
况 。 在 数据 类 型 上 ， 大 数据 技术 使 得 征 信 数 据 不 再 限于 数字 、 字 符 这 些 结构 化 数据 ， 还 包 
括 图 片 、 音 频 、 视 频 等 非 结 构 化 数据 。 例 如 ， 交 通 银行 信用 卡 中 心 通过 智能 语音 分 析 技 
术 ， 提 炼 出 隐藏 在 音频 数据 中 的 客户 信息 进行 分 析 应 用 ， 每 天 的 数据 处 理 量 达到 20GB。 


2. 征 信服 务 


在 大 数据 时 代 ， 征 信 机 构 的 服务 更 加 及 时 、 高 效 、 全 面 。 例 如 ， 在 营销 服务 方面 ， 征 
信 机 构 运用 大 数据 技术 对 客户 相关 数据 信息 进行 收集 ， 色 勒 客户 画像 ， 从 多 个 方面 对 客户 
群体 进行 细 分 ， 从 而 提供 差异 化 服务 ， 使 得 营销 服务 更 具有 针对 性 和 有 效 性 。 在 客户 维护 
方面 ， 大 数据 技术 可 以 帮助 征 信 机 构 更 加 便捷 、 及 时 、 有 效 地 收集 和 分 析 客 户 对 征 信 产品 
和 服务 效果 的 需求 ， 及 时 反馈 客户 提出 的 问题 和 建议 ， 从 而 提升 客户 忠诚 度 。 与 此 同时 ， 
还 可 以 运用 大 数据 技术 对 客户 使 用 服务 的 相关 数据 和 征 信 机 构 所 流失 客户 的 相关 数据 进行 
挖掘 分 析 ， 有 助 于 预测 发 现 可 能 流失 的 客户 ， 从 而 及 时 对 客户 维护 策略 加 以 改进 ， 保 证 客 
户 群 体 的 稳定 。 


3. 数据 采集 


征 信 机 构 传 统 的 数据 采集 手段 因 机 构 性 质 不 同 而 有 差异 。 一 种 是 公共 征 信 机 构 ， 一 般 
是 由 中 央 银 行经 营 管理 ， 金 融 机 构 (如 商业 银行 、 信 用 卡 公 司 等 ) 被 强制 要 求 定 期 向 中 央 银 
行 报 送 借款 人 的 相关 数据 和 信息 。 另 一 种 是 私人 征 信 机 构 ， 独 立 于 政府 和 大 型 金融 机 构 之 
外 ， 通 常 通过 协议 或 者 合同 的 方式 规范 数据 采集 ， 其 数据 的 主要 来 源 有 提供 信息 服务 的 金 
融 机 构 信贷 信息 、 政 府 平台 公布 的 公共 记录 等 。 而 在 大 数据 时 代 ， 通 常 是 采用 人 们 生活 中 
含有 内 建 芯 片 、 传 感 器 、RFID( 无 线 射频 芯片 ) 等 具有 电子 神经 的 感知 设备 产品 收集 数据 信 
息 。 这 些 设 备 与 计算 机 连接 以 后 ， 可 以 随时 随地 对 人 们 生活 产生 的 各 种 数据 进行 收集 ， 所 
收集 的 数据 内 容 更 加 丰富 ， 数 据 类 型 更 加 多 样 。 
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4. 征 信 产 品 

传统 的 征 信 产 品 主要 包括 信用 报告 、 信 用 评分 、 信 用 评级 、 信 用 风险 管理 类 产品 。 在 
大 数据 时 代 ， 大 数据 技术 有 助 于 提升 征 信 产品 的 质量 ， 推 动 征 信 产 品 的 创新 ， 扩 展 产品 服 
务 范围 ， 促 进 征 信 业 的 发 展 。 例 如 ， 在 征 信 产 品 推销 方面 ， 可 以 运用 大 数据 技术 对 客户 的 
生活 习惯 等 数据 进行 挖掘 分 析 ， 预 测 客户 的 潜在 需求 ， 有 针对 性 地 为 客户 推销 相应 的 征 信 
产品 。 在 征 信 产 品 的 改进 方面 ， 大 数据 时 代 的 信用 报告 可 以 结合 客户 的 生活 习惯、 性 格 特 
点 、 财 务 状况 、 兴 趣 爱 好 等 信息 数据 综合 评判 个 人 信用 状况 。 与 此 同时 ， 征 信 产 品 的 形式 
也 将 更 加 多 样 化 ， 不 仅 可 以 是 上 报 的 报表 、 可 视 化 的 图 表 、 详 细 的 可 视 化 分 析 ， 还 可 以 是 
简单 的 微 博 或 视频 信息 等 。 此 外 ， 大 数据 技术 的 应 用 能 够 使 得 信用 评分 和 信用 评级 更 加 准 
确 合理 。 


1.4.5 互联 网 金融 中 的 大 数据 应 用 


近 几 年 ， 互 联网 金融 迅速 发 展 ， 并 不 断 出 现 新 的 模式 和 应 用 ， 但 其 本 质 还 是 属于 金融 
范畴 。 互 联网 金融 自然 产生 大 数据 ， 它 是 大 数据 应 用 最 为 广泛 的 领域 。 其 核心 是 数据 ， 互 
联网 金融 业 竞 争 力 的 强 弱 未 来 将 取决 于 数据 的 规模 、 数 据 的 有 效 性 、 数 据 的 真实 性 、 数 据 
分 析 和 应 用 的 能 力 。 其 中 ， 大 数据 技术 是 互联 网 金融 的 重要 技术 支撑 。 人 们 在 网 上 活动 的 
信息 都 会 形成 数据 ， 运 用 大 数据 技术 对 数据 进行 收集 、 整 理 、 挖 掘 、 分 析 和 深度 应 用 ， 从 
而 实现 互联 网 金融 产品 、 技 术 、 营 销 和 风险 的 创新 管理 。 目 前 ， 互 联网 金融 的 大 数据 应 用 
包括 精准 营销 、 风 险 管 理 、 信 用 评价 等 。 互 联网 金融 方兴未艾 ， 相 信 还 会 不 断 出 现 新 的 
应 用 。 


1. 精准 营销 


大 数据 的 应 用 给 传统 的 互联 网 金融 营销 模式 带 来 了 巨大 变革 。 互 联网 公司 可 以 运用 大 
数据 技术 对 客户 在 互联 网 上 记录 的 交易 、 支 付 、 评 价 等 行为 数据 信息 进行 挖掘 分 析 ， 根 据 
客户 的 特征 、 需 求 和 偏好 细 分 客户 群体 ， 对 客户 进行 分 类 管理 ， 针 对 每 一 类 别 的 客户 定向 
投放 广告 和 定制 产品 ， 从 而 实现 精准 营销 。 例 如 ， 支 付 宝 聘请 了 两 家 位 于 硅谷 的 数据 分 析 
实验 室 从 事 行为 分 析 ， 将 客户 细 分 成 50 个 族群 进行 研究 。 亚 马 进 运 用 大 数据 技术 对 客户 
的 浏览 记录 、 购 买 行为 等 进行 挖掘 分 析 ， 进 而 预测 客户 的 潜在 需求 。 梧 桐 理财 针对 能 够 承 
担 “ 两 万 元 起 投 ” 的 中 产 阶级 推出 两 万 元 起 点 的 互联 网 金融 理财 产品 “梧桐 宝 ”， 预 期 年 
化 收益 率 为 8% 一 10%。 速 溶 网 针对 大 学 生 及 毕业 生 推出 互联 网 金融 产品 “速溶 360”。 此 
外 ， 住 金 所 针对 中 小 微 企 业 的 银行 贷款 周转 业务 推出 了 互联 网 金融 产品 “安心 一 过 

2. 风险 管理 

金融 创新 和 金融 风险 相伴 相生 。 互 联网 金融 在 提高 金融 效率 的 同时 ， 也 带 来 了 一 些 难 
以 防范 的 风险 。 市 场 风 险 、 信 用 风险 、 流 动 性 风险 、 法 律 风 险 、 操 作风 险 等 都 有 不 同 程度 
的 暴露 ， 且 交织 在 一 起 。 例 如 ，P2P 网 贷 公 司 倒闭 、 老 板 跑 路 、 拆 标 等 的 恶意 欺诈 ， 资 金 
池 、 非 法 集资 等 违法 事件 频繁 发 生 。 在 大 数据 时 代 ， 运 用 大 数据 技术 能 够 及 时 发 现 风险 暴 
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露 ， 采 取 措 施加 以 规避 和 防范 。 在 流动 性 风险 的 防范 方面 ， 余 额 宝 通过 对 支付 宝 的 大 数据 
(如 客户 数量 、 流 量 转化 率 、 客 户 评价 等 ) 进 行 挖掘 分 析 ， 总 结 出 大 量 客户 申购 赎 回 情况 、 
客户 结构 、 客 户 行为 规律 ， 据 此 预测 出 客户 下 一 次 申购 赎 回 的 时 间 ， 从 而 做 出 预案 以 化 解 
流动 性 风险 。 在 客户 流失 方面 ， 支 付 宝根 据 客户 开启 和 注销 账户 的 数据 建立 了 流失 预警 模 
型 ， 进 而 采取 相应 的 措施 争取 和 留 住 客户 。 在 系统 性 风险 的 防范 方面 ， 监 管 部 门 通 过 对 大 
数据 的 挖掘 分 析 对 互联 网 技能 进行 实时 预警 ， 及 时 处 理 突 发 性 事件 ， 防 止 系统 性 风险 的 
发 生 。 

3. 信用 评价 

大 数据 时 代 的 到 来 引发 了 对 涉足 互联 网 金融 客户 信用 评价 的 变革 。 客 户 的 信用 评价 不 
仅 包 括 对 评价 对 象 静态 信息 的 分 析 ， 还 包括 动态 信息 的 分 析 挖掘 ， 同 时 这 也 是 最 重要 的 。 
征 信 机 构 可 以 通过 大 数据 技术 对 客户 的 注册 登记 信息 (静态 信息 ) 以 及 他 们 在 网 络 上 的 购 
物 、 支 付 、 投 资 、 生 活 、 公 益 等 数据 (动态 信息 ) 分 析 挖 掘 ， 形 成 用 户 的 行为 轨迹 ， 通 过 交 
又 检验 ， 对 客户 的 真实 身份 进行 识别 ， 进 而 建立 信用 评价 模型 ， 对 客户 进行 分 类 ， 再 提供 
有 针对 性 的 服务 。 例 如 ， 阿 里 巴巴 基于 淘宝 商户 的 数据 ， 对 其 电 商 生态 圈 内 潜在 的 客户 提 
供 纯 信用 贷款 。 阿 里 和 腾讯 拟 推出 的 “虚拟 信用 卡 ”， 用 户 可 以 实现 网 上 申请 ， 经 过 对 用 
户 交易 大 数据 核查 ， 即 可 授予 一 定 的 信用 额度 。 微 众 银行 通过 大 数据 技术 对 贷款 人 的 银行 
储蓄 、 贷 款 数 据 、 信 用 卡 数 据 、 社 交 数 据 等 进行 挖掘 分 析 ， 从 而 对 贷款 人 进行 信用 评估 ， 
并 据 此 授予 贷款 人 一 定 的 贷款 额度 。 阿 里 的 芝麻 信用 、 腾 讯 的 征 信 产 品 、 微 信 的 公众 号 个 
人 信用 评分 等 都 是 互联 网 个 人 征 信 的 开始 。 


(OW 大 数据 金融 模式 


按照 大 数据 服务 所 处 的 环节 ， 可 以 把 大 数据 金融 划分 为 平台 金融 模式 和 供应 链 金融 模 
式 。 建 立 在 B2B、B2C 或 C2C 基础 上 的 现代 产业 通过 在 平台 上 凝聚 的 资金 流 、 物 流 、 信 
息 流 组 成 了 以 大 数据 为 基础 的 平台 金融 ， 例 如 阿里 金融 以 及 未 来 可 能 进入 这 一 领域 的 电信 
运营 商 ， 建立 在 传统 产业 链 上 下 游 的 企业 通过 资金 流 、 物 流 、 信 息 流 组 成 了 以 大 数据 为 基 
础 的 供应 链 金融 ， 璧 如 京东 金融 平台 、 苏 宁 易 购 的 供应 链 金融 模式 。 


1.5.1 平台 金融 模式 


平台 金融 模式 是 基于 电 商 平台 基础 上 形成 的 网 上 交易 信息 与 网 上 支付 形成 的 大 数据 金 
融 ， 通 过 云 计算 和 模型 数据 处 理 能 力 而 形成 的 信用 或 订单 融资 模式 。 与 传统 金融 依靠 抵押 
或 担保 的 金融 模式 相 比 ， 不 同 之 处 在 于 : 阿里 小 贷 等 平台 金融 模式 主要 基于 对 电 商 平台 的 
交易 数据 、 社 交 网 络 的 用 户 交易 与 交互 信息 和 购物 行为 习惯 等 的 大 数据 进行 云 计 算 来 实时 
计算 得 分 和 分 析 处 理 ， 形 成 网 络 商户 在 电 商 平台 中 的 累积 信用 数据 ， 通 过 电 商 所 构建 的 网 
络 信用 评级 体系 和 金融 风险 计算 模型 及 风险 控制 体系 ， 实 时 向 网 络 商户 发 放 订单 贷款 或 者 
信用 贷款 ， 批 量 、 快 速 、 高 效 ， 例 如 阿里 小 贷 可 实现 数 分 钟 之 内 发 放贷 款 。 
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【案例 1.1】 阿里 小 贷 模式 

阿里 小 贷 以 “封闭 流程 + 大 数据 ”的 方式 开展 金融 服务 ， 凭 借 电 子 化 系统 对 贷款 人 的 
信用 状况 进行 核定 ， 发 放 无 抵押 的 信用 贷款 及 应 收 账 款 抵押 贷款 ， 单 笔 金额 在 5 万 元 以 
内 ， 与 银行 的 信贷 形成 了 非常 好 的 互补 。 阿 里 金融 目前 只 统计 、 使 用 自己 的 数据 ， 并 且 会 
对 数据 进行 真 伪 性 识别 、 虚 假 信息 判断 。 阿 里 金融 通过 其 庞大 的 云 计算 能 力 及 数 十 位 优秀 
建 模 团 队 的 多 种 模型 ， 为 阿里 集团 的 商户 、 店 主 时 时 计算 其 信用 额度 及 其 应 收 账 款 数量 ， 
依托 电 商 平台 、 支 付 宝 和 阿里 云 ， 实 现 客户 、 资 金 和 信息 的 封闭 运行 ， 一 方面 有 效 降低 了 
风险 因素 ， 同 时 真正 做 到 了 一 分 钟 放贷 。 京东 、 苏 宁 的 供应 链 金 融 模式 则 是 以 电 商 作为 核 
心 企 业 ， 以 未 来 收益 的 现金 流 作为 担保 ， 获 得 银行 授信 ， 为 供 货 商 提供 贷款 。 

在 阿里 小 贷 业 务 决策 中 ， 数 据 分 析 发 挥 了 核心 作用 。 阿 里 小 贷 有 超过 上 百 个 数据 模 
型 ,覆盖 贷 前 、 贷 中 、 贫 后 管理 ， 反 欺诈 ， 市 场 分 析 ， 信 用 体系 ， 创 新 研究 等 板块 。 其 决 
策 系统 每 天 处 理 的 数据 量 达到 10TB。 数 据 分 析 用 于 向 公司 的 管理 决策 层 提供 科学 客观 的 
分 析 结 果 和 建议 ， 并 对 业务 流程 提出 优化 改进 方案 。 水 文 模型 就 是 阿里 小 贷 2013 年 着 重 
搭建 的 重要 数据 模型 之 一 。 

在 信贷 风险 防范 上 ， 阿 里 小 贫 微 贷 技术 有 完整 的 风险 控制 体系 。 阿 里 小 贷 建立 了 多 层 
次 的 微 贷 风险 预警 和 管理 体系 。 具 体 来 看 ， 贷 前 、 贫 中 以 及 贷 后 3 个 环节 环 环 相 扣 ， 利 用 
数据 采集 和 模型 分 析 等 手段 ， 根 据 小 微 企 业 在 阿里 巴巴 平台 上 积累 的 信用 及 行为 数据 ， 可 
以 对 企业 的 还 款 能 力 和 还 款 意 愿 进 行 较 准 确 的 评估 。 同 时 结合 贷 后 监控 和 网 络 店铺 的 账号 
关 停机 制 ， 可 以 提高 客户 违约 成 本 ， 有 效 地 控制 贷款 风险 。 如 图 1.12 所 示 是 阿里 小 贷 业 务 
流程 。 


网 络 贷款 系统 : 由 阿里 巴巴 金融 研发 、 维 护 和 更 新 | 


[mm 阿里 云 计算 平 台 ,| 
支付 宝 提供 资金 通道 和 服务 


1.12 ”阿里 小 贷 业务 流程 
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1.5.2 ”供应 链 金融 模式 


供应 链 金 融 模式 是 企业 利用 自身 所 处 的 产业 链 上 下 游 (原料 商 、 制 造 商 、 分 销 商 、 零 售 
商 )， 充 分 整合 供应 链 资源 和 客户 资源 ， 提 供 金融 服务 而 形成 的 金融 模式 。 京 东 商 城 、 苏 宁 
易 购 是 供应 链 金融 的 典型 代表 。 其 以 电 商 作为 核心 企业 ， 以 未 来 收益 的 现金 流 作为 担保 ， 
获得 银行 授信 ， 为 供 货 商 提供 贷款 。 京 东 商 城 作为 电 商 企业 并 不 直接 开展 贷款 的 发 放 工 
作 ， 而 是 与 其 他 金融 机 构 合作 ， 通 过 京东 商城 所 累积 和 掌握 的 供应 链 上 下 游 的 大 数据 金融 
库 ， 来 为 其 他 金融 机 构 提 供 融资 信息 与 技术 服务 ， 把 京东 商城 的 供应 链 业 务 模式 与 其 他 金 
融 机 构 科 现 无 绑 连 放 ， 共同 服务 于 京东 商城 的 电 商 平台 客户 。 在 供应 链 金融 模式 中 ， 电 商 

平台 只 是 作为 信息 中 介 提 供 大 数据 金融 ， 并 不 承担 融资 风险 及 防范 风险 等 。 


【案例 1.2】 京东 金融 


京东 金融 于 2012 年 开始 涉足 金融 服务 ， 同 年 ， 京 东 金 融 自 主 研发 产品 获得 银监会 审 
批 ，2013 年 12 月 推出 京 保 贝 。 金 融 业务 正在 成 为 京东 不 可 或 缺 的 一 部 分 ， 而 在 2014 年 3 
月 7 日 ， 京 东 低 调 上 线 理财 产品 “小 金库 ”， 更 证 明了 京东 对 于 金融 领域 的 野心 。 

一 般 企 业 在 与 核心 企业 合作 时 ， 既 要 保证 供 货 ， 还 要 承受 应 收 账 款 周期 过 长 的 风险 ， 
资金 往往 成 为 最 大 的 压力 。 而 这 些 企 业 往往 因为 规模 小 ， 资 金 薄弱 ， 难 以 得 到 银行 的 贷 
款 ， 资 金 链 断 裂 成 为 笼 音 在 这 些 企 业 头 上 的 阴影 。 京 东 正 是 利用 用 户 数 据 和 现 有 的 金融 体 
系 ， 根据 每 个 环 链 上 的 业务 需求 ， 满 足 中 小 微 企业 的 金融 需求 。 

京东 做 金融 有 其 天 然 优 势 ， 京东 有 非常 优质 的 上 游 供 应 商 ， 还 有 下 游 的 个 人 消费 者 ， 
积累 了 非常 多 潜在 的 金融 业务 客户 。 有 大 数据 现成 的 资源 ， 京 东 选 择 金 融 水 到 汇 成 。 

在 传统 的 贸易 融资 中 ， 人 金融 机 构 只 针对 单一 企业 进行 信用 风险 评估 并 据 此 做 出 是 否 授 
信 的 决策 ， 而 在 供应 链 金 融 模式 下 ， 银 行 更 加 关注 的 是 申 贷 企业 的 真实 贸易 背景 、 历 史 信 
誉 状况 ， 而 不 仅 是 财务 指标 。 这 样 ， 一 些 因 财 务 指标 不 达标 而 难以 融资 的 中 小 企业 ， 就 可 
以 凭借 交易 真实 的 单 笔 业务 来 获得 贷款 ， 满 足 其 资金 需求 。 并 且 银 行 通过 资金 的 封闭 式 运 
作 ， 确 保 每 笔 真实 业务 发 生 后 的 资金 回笼 ， 以 达到 控制 贷款 风险 的 目的 。 

如 今 ， 大 数据 的 应 用 更 让 京东 在 这 方面 如 虎 添 翼 。 例 如 ，2013 年 12 月 推出 的 京 保 
贝 ， 针 对 京东 上 下 游 合作 商 提供 快速 融资 的 服务 ， 供 应 商 可 赁 采购 、 销 售 、 财 务 等 数据 快 
速 获得 融资 。 通 过 大 数据 ， 以 往 需要 人 工 进行 的 判断 、 审 核 等 流程 可 实现 自动 化 审批 和 风 
险 控 制 ， 从 供应 商 申 请 融资 开始 ， 全 部 由 系统 实现 对 放款 审核 的 判断 ， 放 款 过 程 全 程 自动 
化 ， 因 此 可 以 做 到 3 分 钟 融资 到 账 ; 且 无 需 任何 担保 和 抵押 ， 能 有 效 地 提高 企业 营运 资金 
周转 效率 。 

未 来 京东 金融 会 覆盖 更 多 的 融资 服务 ， 而 对 于 产生 的 数据 ， 包 括 消费 数据 、 物 流 数 
据 、 供 应 商 财 务 信息 以 及 金融 状况 信息 ， 将 通过 大 数据 技术 进行 有 效 的 分 析 ， 风 险 状 况 也 
能 够 实时 监控 。 同时， 在 了 解 客户 需求 的 前 提 下 ， 提 供 简 单 融 资 、 快 乐 融资 的 融资 服务 。 


(资料 来 源 : 数据 库 频道 ) 
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(OT 大 数据 金融 信息 安全 


21 世纪 以 来 ， 随 着 信息 技术 产业 的 迅速 发 展 ， 大 数据 产业 成 为 新 时 代 背 景 下 继 云 计 
算 、 物 联网 的 发 明 与 广泛 应 用 之 后 又 一 大 技术 产业 创新 点 。 金 融 业 通 过 大 数据 的 应 用 ， 催 
生出 基于 大 数据 的 客户 管理 、 营 销 管理 、 风 险 管理 等 应 用 ， 商 业 模式 、 运 营 方式 、 业 务 模 
式 等 不 断 创 新 。 但 在 大 数据 产业 呈现 爆炸 式 增长 的 同时 ， 其 大 数据 信息 安全 管理 水 平 却 呈 
现 非 对 称 发 展 ， 所 以 对 现 有 的 信息 安全 手段 提出 了 更 高 的 要 求 。 特 别 是 大 数据 技术 在 金融 
行业 的 应 用 ， 现 在 的 金融 信息 化 已 全 面 进入 信息 安全 管理 阶段 ， 对 计算 机 信息 系统 有 着 高 
度 的 依赖 性 ， 使 得 金融 信息 安全 面临 多 方面 的 威胁 ， 包 括 大 数据 集群 数据 库 的 数据 安全 威 
胁 、 智 能 终端 的 数据 安全 威胁 以 及 数据 虚拟 化 带 来 的 泄密 威胁 。 大 数据 时 代 背 景 下 ， 高 度 
信息 化 的 金融 系统 所 面临 的 危险 系数 更 高 ， 必 须 建立 起 全 方位 、 多 层次 、 可 动态 发 展 的 金 
融 安 全 信息 保障 体系 ， 以 确保 金融 信息 的 安全 。 金 融 信息 安全 防范 体系 可 以 从 这 样 几 个 方 
面 完 善 ， 建立 核心 信息 区 安全 防护 系统 ， 建 立信 息 交流 区 安全 防护 系统 ， 建 立 内 部 系统 安 
全 防护 系统 ;建立 分 支 节点 区 安全 防护 系统 ， 建 立 管理 区 安全 防护 系统 。 


(OD 到》 大 数据 应 用 案例 


1.7.1 案例 之 一 : 滴 滴 出 行 


目前 ， 滴 滴 已 成 为 整个 中 国 甚至 全 球 发 展 最 快 的 互联 网 公司 。 拥 有 3 亿 用 户 ， 在 中 国 
400 多 个 城市 开展 服务 ， 司 机 超过 1400 万 人 ，1400 万 的 司机 是 整个 中 国 所 有 机 动车 总 量 
的 10%。 每 天 服务 的 订单 超过 1300 万 个 ， 这 个 订单 量 让 滴 滴 成 为 仅 次 于 淘宝 的 中 国 第 二 
大 互联 网 交易 平台 。 目 前 ， 滴 滴 平 台 上 每 天 产生 超过 50TB 的 数据 (相当 于 5 万 部 电影 )， 
超过 90 亿 路 径 规划 次 数 。 截 至 2015 年 12 月 ， 滴 滴 出 行 占据 我 国 网 约 车 市 场 46.6% 的 市 场 
份额 ， 神 州 专车 以 39.9% 的 比例 排名 第 二 ，Uber 占 7.2%， 排 名 第 三 。 滴 滴 、Uber 合并 之 
前 ， 快 车 市 场 基本 算是 两 家 的 二 人 转 ; 合并 之 后 ， 占 据 专车 市 场 90% 以 上 的 份额 ， 算 是 快 
车 市 场 的 唯一 选择 。2015 年 ， 滴 滴 出 行 平台 完成 14.3 亿 订 单 ， 这 相当 于 在 中 国平 均 每 个 
人 都 使 用 滴 滴 打 过 一 次 车 ， 累 计 行驶 里 程 达 128 亿 公 里 ， 相 当 于 环绕 中 国 行驶 29 万 圈 ， 
累计 行驶 时 间 达 4.9 亿 小 时 ， 相 当 于 昼夜 不 得 地 行驶 56 000 年 。 所 以 滴 滴 的 “数据 大 脑 ” 
对 弈 的 是 现实 出 行 的 海量 数据 ， 通 过 对 每 天 24 小 时 不 间断 产生 的 新 数据 ， 以 及 检测 这 些 
数据 本 身 产生 的 二 度数 据 ， 包 括 ETA、 路 径 规划 、 实 际 路 线 、 匹 配 时 间 等 ， 进 行 研究 、 学 
习 ， 最 终 实现 订单 匹配 效率 的 提升 ， 使 司机 取得 更 多 收入 ， 乘 客 更 加 快捷 出 行 。 

在 业界 看 来 ， 这 巨大 订单 量 背 后 实则 体现 的 是 滴 滴 出 行 超 强 的 大 数据 计算 能 力 。 比 
如 ， 如 何 将 信息 推送 给 更 适合 区 域内 的 司机 、 谁 优先 获得 订单 ， 如 何 给 乘客 和 司机 补贴 等 
策略 ， 都 要 依靠 大 数据 的 支持 。 滴 滴 根 据 成 交 率 和 应 答 率 来 进行 智能 激励 ， 以 此 增加 用 户 
的 叫 车 意愿 ， 而 通过 大 数据 计算 ， 则 让 订单 匹配 更 加 智能 ， 实 现 了 智能 派 单 。 例 如 ， 以 前 
司机 需要 开 3 公里 才能 接 到 1 个 客人 ， 但 现在 可 能 0.5 公里 就 能 接 到 客人 ， 在 节省 时 间 的 
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同时 ， 每 天 的 订单 成 交 量 也 会 增加 。 
全 
平台 运 


- 滴 滴 大 数据 与 平台 运营 管理 
1) ”供需 预测 
大 数据 的 神奇 之 处 就 在 于 可 以 通过 搜集 到 的 数据 ， 进 行 处 理 分 析 后 ， 得 到 规律 ， 然 后 


利用 这 个 规律 对 未 来 进行 预测 。 在 交通 方面 ， 大 数据 预测 的 能 力 极 为 重要 ， 可 以 预测 什么 
时 间 什 么 地 方 会 拥堵 。 

大 数据 预测 的 关键 是 有 足够 多 的 、 高 质量 的 数据 。 当 前 滴 滴 每 日 峰值 订单 超过 2000 
万 单 、 每 日 处 理 数据 超过 2000TB， 和 覆盖 了 交通 路 况 、 用 户 叫 车 信息 、 司 机 驾驶 行为 、 车 
辆 数据 等 多 个 维度 ， 它 所 掌握 的 真实 数据 除了 可 以 帮助 预测 路 况 外 ， 还 能 对 供需 进行 预 
测 ， 供 需 预测 越 准 确 ， 越 能 更 好 地 解决 供需 不 平衡 问题 。 

滴 滴 目 前 对 15 分 钟 后 供需 预测 的 准确 度 已 经 达到 85%， 基 于 这 样 的 准确 率 ， 平 台 可 
以 调度 司机 满足 未 来 的 打车 有 效 降低 未 来 该 区 域 供需 不 平衡 的 概率 。 

2) ”路 径 规 划 

路 径 规划 和 ETA 两 项 地 图 技术 是 实现 智能 派 单 的 关键 ， 也 将 直接 影响 到 司 乘 双方 的 
使 用 体验 。 通 过 海量 历史 数据 ， 可 以 对 未 来 路 况 做 预测 ， 实 现 A 点 到 B 点 的 路 径 规 划 ， 
它 是 派 单 的 核心 ， 工 程 师 围绕 最 低 的 价格 、 最 高 的 司机 效率 和 最 佳 交通 系统 运行 效率 来 做 

ETA 是 指 预 估 任 意 起 终点 所 需 的 行驶 时 间 ， 要 求 精准 性 。 滴 滴 将 机 器 学 习 应 用 到 
ETA， 人 “订单 高 效 匹 配 ” 和 “司机 运力 调度 ”的 关键 技术 。 当 前 滴 滴 ETA 可 以 预 
测 每 一 单 出 行 的 时 长 以 及 预 估 在 每 一 个 路 口 前 的 等 待 时 长 ， 这 项 技术 可 以 帮助 滴 滴 在 更 合 
适 的 时 间 对 运力 进行 更 好 的 调度 。 ETA/ 路 径 规 划 及 其 学 习 系 统 如 图 1.13 所 示 。 
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图 1.13 ETA/ 路 径 规划 及 其 学 习 系 统 
3) ”智能 派 单 
滴 滴 叫 车 和 搜索 商品 的 逻辑 不 同 。 网 上 的 商品 、 资 讯 等 信息 都 是 静态 停留 在 那里 ， 计 
算 方 式 只 是 将 这 个 商品 、 信 息 挖掘 出 来 ， 而 滴 滴 的 计算 则 类 似 于 动态 打靶 ， 车 辆 永远 在 运 
动 当 中 ， 要 在 众多 运动 的 车 辆 中 ， 给 乘客 一 个 最 优 的 选择 ， 不 光 是 距离 ， 还 有 时 间 。 滴 滴 
研发 的 基本 原则 是 想 办 法 撮合 乘客 和 司机 ， 满 足 他 们 的 需求 ， 保 证 他 们 的 体验 。 简 单 点 
说 ， 就 是 将 订单 发 送 给 合适 的 司机 。 以 滴 滴 专 车 业务 为 例 ， 目 前 还 要 用 到 人 为 制定 的 规 
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则 ， 例 如 如 何 将 信息 推送 给 最 适合 区 域内 的 司机 、 谁 优先 获得 订单 等 。 在 数据 量 较 小 的 情 
况 下 ， 可 以 基于 规则 、 人 的 经 验 来 设 定 算法 ， 但 是 在 数据 量 更 大 更 丰富 的 情况 下 ， 这 样 的 
做 法 可 能 和 现实 存在 一 定 程度 的 脱节 。 

这 是 一 个 颇 为 繁杂 的 过 程 。 除 了 推荐 算法 要 准确 、 匹 配 效率 要 高 、 计 算 要 快 、 推 送 要 
及 时 外 ， 还 要 在 推送 订单 到 这 位 司机 之 前 ， 通 过 对 小 费 、 长 短途 、 时 间 、 方 向 敏感 等 静态 
特征 和 司机 与 订单 之 间 的 位 置 关系 、 时 间 关 系 等 动态 特征 进行 综合 分 析 来 预测 他 对 订单 感 
兴趣 的 程度 。 智 能 派 单 对 订单 量 和 司机 数 进行 预测 ， 然 后 通过 大 规模 分 布 式 计算 来 实现 上 
述 的 最 优 撮合 。 为 了 实现 这 一 目的 ， 供 需 预测 、 动 态 调价 、 路 径 规划 以 及 服务 分 的 算法 技 
术 要 一 起 发 挥 作用 ， 它 们 最 终 为 实现 最 优派 单 而 服务 ， 它 们 的 算法 都 将 结合 到 智能 派 单 系 
统 中 ， 帮 助 在 动态 环境 中 撮合 乘客 与 司机 的 交易 。 

高 峰 期 滴 滴 平台 每 分 钟 接收 超过 3 万 乘客 需求 ， 每 2 秒 钟 做 一 次 订单 匹配 ， 每 一 次 发 
单 背后 ， 滴 滴 大 脑 运算 次 数 为 百 亿 次 级 别 。 此 外 ， 滴 滴 还 可 使 用 大 数据 技术 来 预 估 每 个 司 
机 的 服务 分 值 ， 包 括 乘客 打分 、 乘 客 评价 、 取 消 率 等 因素 ， 并 利用 算法 模型 来 计算 不 同 服 
务 水 平 的 司机 对 用 户 产生 的 长 期 影响 。 

4) 九 雷 

九 雷 是 滴 滴 大 数据 孵化 的 出 行 领 域 智能 决策 技术 产品 ， 能 够 把 错综复杂 的 时 间 、 空 
间 、 业 务 维度 的 N 次 元 出 行 领域 数据 ， 转 化 成 易于 理解 的 二 次 元 数据 ， 搭 建 数据 理解 的 桥 
梁 ， 帮 助 运营 、 产 品 、BI、 研 发 人 员 发 现 问题 、 分 析 问 题 、 解 决 问 题 ， 产 生 切 实 的 业务 
收益 。 

滴 滴 将 出 行 领域 的 数据 ， 进 行 整理 、 挖 掘 、 智 能 聚合 ， 在 地 图 空间 和 时 间 轴 上 进行 合 
理 的 呈现 ， 使 用 户 能 够 直观 地 感知 在 什么 时 间 、 什 么 地 点 、 各 个 业务 线 的 什么 业务 维度 ( 乘 
客 、 订 单 、 运 力 、 体 验 等 )， 发 生 了 什么 ， 方 便 深 入 追踪 、 探 寻 业 务 痛 点 和 原因 分 析 。 

例如 ， 通 过 九 直 ， 对 地 图 上 任意 区 域 的 供需 平衡 状况 、 订 单 满足 情况 能 够 一 目 了 然 ， 
并 且 结合 九 雷 的 精细 化 分 析 能 力 ， 能 够 细 化 到 某 个 地 理 围栏 的 供需 策略 ， 进 行 围栏 级 别 的 
运力 调度 策略 配置 ，( 在 代 驾 场景 上 ) 基 于 机 器 学 习 进 行 供需 预测 ， 判 断 哪些 区 域 存在 运力 
缺口 ， 自 动 化 调度 司机 调节 供需 平衡 。 实 际 上 ， 九 雷 是 凭借 科学 可 视 化 技术 能 力 、 算 法 能 
力 和 高 性 能 架构 能 力 ， 将 数据 变 为 知识 ， 作 为 决策 依据 。 

此 外 ， 给 乘客 什么 样 的 补贴 、 给 司机 什么 样 的 补贴 、 谁 更 敏感 、 多 少 金额 影响 更 积 
极 ， 这 些 策 略 的 背后 都 是 大 数据 在 起 作用 。 

2. 滴 滴 大 数据 与 城市 智慧 交通 建设 

1) “城市 道路 优化 

对 大 多 数 用 户 而 言 ， 网 约 车 只 是 一 个 打车 工具 。 实 际 上 ， 网 约 车 背后 能 做 的 远 远 不 止 
这 些 。 每 一 次 的 出 行 背后 都 是 数据 的 调动 和 积累 ， 都 是 对 一 座 城 市 更 为 深入 的 了 解 。 对 一 
座 城市 而 言 ， 尤 其 是 一 线 城市 ， 网 约 车 有 着 重大 的 存在 意义 。 

其 一 ， 优 化 用 户 出 行 体验 ， 为 用 户 的 出 行 需求 插 上 互联 网 的 翅膀 。 

其 二 ， 参 与 优化 城市 道路 交通 。 习 惯 网 约 车 后 ， 越 来 越 多 的 用 户 正 在 逐步 减少 开车 次 
数 ， 一 定 程度 上 缓解 了 道路 交通 压力 和 减少 了 汽车 尾气 排放 。 
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其 三 ， 优 化 城市 道路 交通 基础 规划 。 

当 用 户 打开 滴 滴 出 行 APP 叫 车 时 ， 毫 秒 之 间 ， 滴 滴 大 脑 平均 需要 CPU 运算 576 亿 
次 ， 才 能 为 用 户 匹 配 出 最 优 的 车 辆 。 这 个 让 人 难以 置信 的 数字 ， 深 刻 反 映 出 滴 滴 大 脑 惊 人 
的 大 数据 运算 处 理 能 力 。 推 荐 上 车 点 “ 黑 科 技 ” 上 线 后 ， 截 至 2016 年 ， 滴 滴 平台 上 超过 
30% 的 司机 和 乘客 ， 按 照 小 绿 点 不 需要 通话 就 可 以 找到 对 方 ， 司 机 的 通话 量 平均 下 降 
10%， 乘 客 等 候 时 间 平 均 减 少 1 分 钟 。 这 些 黑 科 技 的 背后 ， 其 实 就 是 滴 滴 对 一 座 城市 的 学 
习 ， 并 且 是 动态 的 学 习 。 更 好 地 了 解 学习 城 市 动态 ， 才 能 为 用 户 提供 更 准确 的 出 行 服务 
体验 。 

2) ” 滴 滴 交 通 云 

以 武汉 为 例 ， 滴 滴 大 数据 显示 ， 武 汉 有 超过 50% 的 乘客 愿意 与 别人 分 享 ， 选 择 拼车 出 
行 。2016 年 1 一 10 月 ， 武 汉 有 超过 2900 万 人 次 通过 拼车 和 顺风 车 出 行 。 据 测算 ， 一 辆 充 
分 使 用 的 分 享 汽车 ， 如 果 每 次 行程 能 够 载 2~3 组 目的 地 相近 的 拼车 乘客 ， 每 天 可 减少 
20 一 40 辆 私家 车 上 路 ， 因 而 会 大 大 降低 机 动车 空 驶 率 和 上 路 率 。 武 汉 市 每 天 的 快车 拼车 和 
顺风 车 出 行 达 10.2 万 人 次 ， 如 果 按 私家 车 平均 每 辆 车 每 天 出 行 2 次 ， 每 次 载 客 1.5 人 计 
算 ， 这 相当 于 武汉 每 天 减少 3.4 万 辆 小 汽车 出 行 。 

这 些 庞大 的 海量 数据 ， 都 正 实时 上 传 到 滴 滴 秘密 打造 的 一 条 云 一 一 滴 滴 交 通 云 上 。 滴 
滴 大 脑 在 这 朱云 上 ， 根 据 交 通 度量 体系 设 定 ， 分 析 海 量 数据 ， 让 分 析 结 果 为 乘客 、 司 机 、 
交通 主管 部 门 等 所 有 出 行 参与 方 都 带 来 价值 。 滴 滴 出 行 正 与 武汉 市 交管 局 共同 持续 推进 武 
汉 “ 互 联网 + 交通 ”建设 ， 双 方 将 在 路 况 服 务 、 智 能 交通 云 服 务 等 方面 进行 深度 合作 。 章 
文 册 介绍 ， 被 植 入 滴 滴 交 通 云 的 城市 将 发 生 至 少 三 大 变化 。 

第 一 ， 滴 滴 交 通 云 可 以 利用 智能 调度 优势 帮助 改善 城市 交通 拥堵 问题 。 比 如 ， 在 空间 
维度 ，A 到 B 点 有 很 多 乘客 ， 滴 滴 交 通 云 有 可 能 规划 不 同 的 行驶 道路 ， 让 每 个 路 网 的 车 流 
量 均衡 。 而 在 时 间 维 度 ， 滴 滴 交 通 云 可 以 尝试 对 早 高 峰 出 行 的 人 做 精准 营销 ， 比 如 9 点 出 
行 的 乘客 ， 如 果 8 点 出 行 ， 补 贴 5 元 ， 从 而 在 时 间 维 度 上 ， 达 到 削 峰 填 谷 的 作用 。 

第 二 ， 滴 滴 交 通 云 未 来 还 可 协助 设计 智能 交通 管控 方案 ， 提 高 道路 利用 率 。 比 如 ， 滴 
滴 交 通 云 可 以 实现 智能 信号 灯 控 制 ， 通 过 数据 模型 算出 整个 区 域 的 车 流量 情况 ， 靠 区 域 的 
红绿灯 协调 ， 让 城市 各 条 道路 的 通行 效率 更 高 、 更 流畅 。 

第 三 ， 滴 滴 交 通 云 的 价值 还 将 体现 在 ， 为 城市 的 路 网 优化 提供 决策 依据 。 比 如 ，4 个 
车 道 ， 左 转弯 应 该 一 个 还 是 两 个 ， 滴 滴 交 通 云 都 可 以 给 出 精准 建议 。 滴 滴 交 通 云 也 会 对 新 
建 路 网 做 规划 建议 ， 比 如 ， 应 该 在 哪里 建 路 ， 或 者 要 不 要 建 一 座 桥 等 。 

对 大 众 用 户 而 言 ， 很 难 通过 打车 去 切身 体会 滴 滴 大 数据 的 作用 ， 但 对 于 城市 交通 规划 
部 门 而 言 ， 交 通 大 数据 的 采集 或 许 能 够 针对 性 解决 一 些 实质 问题 ， 尤 其 是 对 一 些 缺 乏 大 型 
城市 交通 规划 能 力 的 城市 而 言 。 

案例 小 结 : 滴 滴 是 一 个 移动 互联 网 产品 ， 依 托 移 动 支付 ， 有 几乎 100% 的 支付 接 入 
率 ， 滴 滴 的 互联 网 金融 想象 空间 很 大 。 滴 滴 将 出 行 连接 结构 化 、 数 据 化 ， 意 味 着 全 程 可 追 
滴 、 可 评价 、 可 反馈 ， 形 成 一 个 促进 司机 服务 不 断 优化 的 正 向 循环 生态 。 滴 滴 生态 里 有 大 
量 司 机 资源 ， 滴 滴 企业 平台 也 是 互联 网 金融 好 场景 ， 滴 滴 账 户 余额 也 可 以 变 身 滴 滴 版 余额 
宝 ， 只 要 有 海量 信任 连接 的 用 户 ， 一 切 都 是 可 以 想象 的 。 
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1.7.2 案例 之 二 : 大 数据 与 美 团 外 卖 的 精细 化 运营 


美 团 最 初 是 一 个 互联 网 公司 ， 美 团 的 团队 之 前 做 校内 网 (人 人 网 的 前 身 )， 后 来 做 饭 否 
网 ， 再 后 来 因为 某 些 原因 饭 否 网 被 关 掉 之 后 ， 开 始 转 做 美 团 网 。2013 年 11 月 上 线 的 美 团 
外 卖 ， 在 两 年 半 的 时 间 内 成 为 中 国 最 大 的 外 卖 平台 ， 最 近日 订单 已 经 突破 400 万 份 ， 这 个 
数字 放 在 所 有 电 商 交易 平台 里 也 能 轻松 排 到 前 列 。 而 这 种 高 速 发 展 的 背后 ， 与 大 数据 技术 
的 支撑 和 精细 化 运营 是 分 不 开 的 。 美 团 外 卖 首先 是 一 个 线 下 商户 与 线 下 消费 者 的 线 上 交易 
平台 ， 对 商户 来 说 ， 一 方面 美 团 可 以 帮 商 户 解 决 知名 度 的 问题 ， 可 以 通过 这 个 平台 触 达 更 
多 的 用 户 。 另 一 方面 ， 由 于 很 多 的 消费 不 是 发 生 在 线 下 ， 商 户 不 需要 租用 一 个 大 面积 、 好 
地 段 的 商铺 ， 可 以 减少 店铺 的 租金 。 对 消费 者 来 说 ， 可 以 有 更 多 的 选择 ， 并 且 对 现在 很 多 
追求 生活 享受 的 “宅男 ”“ 宅 女 ”或 一 些 生活 节奏 较 快 的 人 也 非常 方便 。 

外 卖 020 和 传统 的 电 商 存在 一 些 差异 。 可 以 简单 总 结 为 如 下 几 点 。 

一 是 新 事物 ， 快 速 发 展 。 这 意味 着 很 多 用 户 对 外 卖 的 认 知 较 少 ， 对 平台 上 的 新 品类 缺 
乏 了 解 ， 对 自身 的 需求 也 没有 充分 意识 。 平 台 需 要 去 发 现 用 户 的 消费 意愿 ， 以 便 对 用 户 的 
消费 进行 引导 。 

二 是 高 频 。 外 卖 是 个 典型 的 高 频 02O 应 用 。 一 方面 ， 消 费 频 次 高 ， 用 户 生命 周期 相 
对 好 判定 ， 另 一 方面 ， 消 费 单价 较 低 ， 用 户 决策 时 间 短 、 随 意 性 大 。 

三 是 场景 驱动 。 场 景 是 特定 的 时 间 、 地 点 和 人 物 的 组 合 下 的 特定 的 消费 意图 。 不 同 的 
时 间 、 地 点 ， 不 同类 型 的 用 户 的 消费 意图 会 有 差异 。 例 如 ， 白 领 在 写字 楼 中 午 的 订单 一 般 
是 工作 餐 ， 通 常 在 营养 、 品 质 上 有 一 定 的 要 求 ， 且 单价 不 能 太 高 ， 而 到 了 周末 晚上 的 订单 
大 多 是 夜 宦 ， 追 求 口味 且 价 格 弹性 较 大 。 场 景 辨 识 越 细致 ， 越 能 了 解 用 户 的 消费 意图 ， 运 
营 效果 就 越 好 。 

四 是 用 户 消费 的 地 理 位 置 相对 固定 。 结 合 地 理 位 置 判 断 用 户 的 消费 意图 是 外 卖 的 一 个 
特点 。 


1. 大 数据 在 美 团 外 卖 画像 技术 中 的 应 用 


美 团 外 卖 经 过 3 年 的 飞速 发 展 ， 品 类 已 经 从 单一 的 外 卖 扩展 到 了 美食 、 夜 宵 、 鲜 花 、 
商 超 等 多 个 品类 。 用 户 群 体 也 从 早期 的 以 学 生 为 主 扩展 到 白领 、 社 区 以 及 商旅 ， 甚 至 包括 
在 KTV 等 娱乐 场所 消费 的 人 群 。 随 着 供给 和 消费 人 群 的 多 样 化 ， 如 何在 供给 和 用 户 之 间 
做 一 个 对 接 ， 就 是 用 户 画 像 的 一 个 基础 工作 。 所 谓 千 人 千 面 ， 画 像 需 要 刻画 不 同人 群 的 消 
费 习 惯 和 消费 偏好 。 

1) ”外 卖 产品 运营 对 画像 技术 的 要 求 

我 们 大 致 可 以 把 一 个 产品 的 运营 分 为 用 户 获取 和 用 户 拓展 两 个 阶段 。 在 用 户 获取 阶 
段 ， 用 户 因 为 自然 原因 或 一 些 营销 事件 (如 广告 、 社 交 媒 体 传播 ) 产 生 对 外 卖 的 注意 ， 进 而 
产生 了 兴趣 ， 并 在 合适 的 时 机 下 完成 首 购 ， 从 而 成 为 外 卖 新 客 。 在 这 一 阶段 ， 运 营 的 重点 
是 提高 效率 ， 通 过 一 些 个 性 化 的 营销 和 广告 手段 ， 吸 引 到 真正 有 潜在 需求 的 用 户 ， 并 刺激 
其 转化 。 在 用 户 完 成 转化 后 ， 接 下 来 的 运营 重点 是 拓展 用 户 价值 。 这 里 有 两 个 问题 。 第 一 
个 问题 是 提升 用 户 价值 ， 具 体 而 言 就 是 提升 用 户 的 单 均 价 和 消费 频次 ， 从 而 提升 用 户 的 


大 数据 全 融 概述 慎 且 1 二 


LTV(life-time value)。 基 本 手段 包括 交叉 销售 (新 品类 的 推荐 )、 向 上 销售 (优质 高 价 供给 的 
推荐 ) 以 及 重复 购买 (优惠 、 红 包 刺 激 重 复 下 单 以 及 优质 供给 的 推荐 带 来 下 单 频 次 的 提升 )。 
第 二 个 问题 是 用 户 的 留存 ， 通 过 提升 用 户 总 体 体验 以 及 在 用 户 有 流失 倾向 时 通过 促销 和 优 
惠 将 用 户 留 在 外 卖 平 台 。 所 以 用 户 所 处 的 体验 阶段 不 同 ， 运 营 的 侧重 点 也 需要 有 所 不 同 。 
而 用 户 画 像 作为 运营 的 支撑 技术 ， 需 要 提供 相应 的 用 户 刻画 以 满足 运营 需求 。 如 图 1.14 
所 示 为 美 团 用 户 体验 过 程 。 


图 1.14 用 户 体验 过 程 


2) ”外 卖 画像 系统 架构 

画像 服务 的 架构 包括 : 数据 源 包括 基础 日 志 、 商 家 数据 和 订单 数据 。 数 据 完成 处 理 后 
存放 在 一 系列 主题 表 中 ， 再 导入 kv 存储 ， 给 下 游 业 务 端 提供 在 线 服 务 。 同 时 会 对 整个 业 
务 流程 实施 监控 。 主 要 分 为 两 部 分 ， 第 一 部 分 是 对 数据 处 理 流 程 的 监控 ， 利 用 内 部 自 研 的 
数据 治理 平台 ， 监 控 每 天 各 主题 表 产 生 的 时 间 、 数 据 量 以 及 数据 分 布 是 否 有 异常 。 第 二 部 
分 是 对 服务 的 监控 。 目 前 画像 系统 支持 的 下 游 服务 包括 广告 、 排 序 、 运 营 等 系统 。 如 
图 1.15 所 示 为 美 团 画像 系统 架构 。 

2. 大 数据 在 美 团 外 卖 客户 挖掘 和 预测 中 的 应 用 

1) “新 客运 营 

新 客运 营 主要 需要 回答 下 列 3 个 问题 。 

(1) 新 客 在 哪里 ? 

(2) 新 客 的 偏好 如 何 ? 

(3) 新 客 的 消费 力 如 何 ? 
回答 这 3 个 问题 是 比较 困难 的 ， 因 为 相对 于 老 客 而 言 ， 新 客 的 行为 记录 非常 少 或 者 几 
乎 没有 。 这 就 需要 通过 一 些 技术 手段 做 出 推断 。 例 如 ， 新 客 的 潜在 转化 概率 ， 受 到 新 客 的 
人 口 属性 (职业 、 年 龄 等 )、 所 处 地 域 (需求 的 因素 )、 周 围 人 群 (同样 反映 需求 ) 以 及 是 否 有 充 
足 供 给 等 因素 的 影响 ， 而 对 于 新 客 的 偏好 和 消费 力 ， 从 新 客 在 到 店 场景 下 的 消费 行为 可 以 
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做 出 推测 。 另 外 用 户 的 工作 和 居住 地 点 也 能 反映 他 的 消费 能 力 。 


画像 三 
9 Ff 由 疏 务 本 


CB- mm 


ETL 牙 控 服务 监控 ”有 岂 
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对 新 客 的 预测 大 量 依赖 于 他 在 到 店 场景 下 的 行为 ， 而 用 户 的 到 店 行为 对 于 外 卖 是 比较 
稀疏 的 ， 大 多 数 用 户 是 在 少数 几 个 类 别 上 有 过 一 些 消费 行为 。 这 就 意味 着 需要 考虑 选择 什 
么 样 的 统计 量 描述 ， 如 消费 单价 ， 总 消费 价格 ， 消 费 品 类 ， 等 等 。 然 后 通过 大 量 的 试验 来 
验证 特征 的 显著 性 。 另 外 ， 由 于 数据 比较 稀疏 ， 需 要 考虑 合适 的 平滑 处 理 。 

美 团 在 做 高 潜 新 客 挖掘 时 ， 融 入 了 多 方 特征 ， 通 过 特征 的 组 合 最 终 做 出 一 个 效果 比较 
好 的 预测 模型 。 美 团 能 够 找到 一 些 高 转化 率 的 用 户 ， 其 转化 率 比 普通 用 户 高 若干 倍 。 通 过 
对 高 潜 用 户 有 针对 性 的 营销 ， 可 以 极 大 提高 营销 效率 。 

2) ”流失 预测 

新 客 来 了 之 后 ， 接 下 来 需要 把 他 留 在 这 个 平台 上 ， 尽 量 延长 生命 周期 。 营 销 领域 关于 
用 户 留 存 的 两 个 基本 观点 是 : 获取 一 个 新 顾客 的 成 本 是 维系 现 有 顾客 成 本 的 5 倍 ; 如 果 将 
顾客 流失 率 降 低 5%， 公 司 利润 将 增加 25%~85%。 

用 户 流失 的 原因 通常 包括 : 竞争 对 手 的 吸引 、 体 验 问 题 和 需求 变化 等 。 美 团 借助 机 器 
学 习 的 方法 ， 构 建 用 户 的 描述 特征 ， 并 借助 这 些 特征 来 预测 用 户 未 来 流失 的 概率 。 这 里 有 
两 种 做 法 : 第 一 种 是 预测 用 户 未 来 若干 天 是 否 会 下 单 这 一 事件 发 生 的 概率 。 这 是 典型 的 概 
率 回 归 问 题 ， 可 以 选择 逻辑 回归 、 决 策 树 等 算法 拟 合 给 定 观测 下 事件 发 生 的 概率 。 第 二 种 
是 借助 于 生存 模型 ， 例 如 COX-PH 模型 ， 做 流失 的 风险 预测 。 图 1.16 左边 是 概率 回归 的 
模型 ， 用 户 未 来 7 天 内 是 否 有 下 单 作为 类 别 标记 y， 然 后 估计 在 观察 到 特征 了 的 情况 下 y 
的 后 验 概率 Po 如 。 右 边 是 用 COX 模型 的 例子 ， 我 们 会 根据 用 户 在 未 来 了 天 是 否 下 单 给 
样本 一 个 类 别 ， 即 观测 时 长 记 为 7。 假设 用 户 的 下 单 的 距 今 时 长 长 T， 将 + 作为 生存 时 长 
t; 否则 将 生存 时 长 + 记 为 T。 这 样 一 个 样本 由 三 部 分 构成 : 样本 的 类 别 (flag)、 生 存 时 长 (1) 
以 及 特征 列表 。 通 过 生存 模型 虽然 无 法 显 式 得 到 P(r'| 如 的 概率 ， 但 其 协 变量 部 分 实际 反映 
了 用 户 流失 的 风险 大 小 。 
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生存 模型 ( 见 图 1.17) 中 ，B™x 反映 了 用 户 流失 的 风险 ， 同 时 也 和 用 户 下 次 订单 的 时 间 
间隔 成 正 相关 。 在 箱 线 图 中 ， 横 轴 为 8 了 x*， 纵 轴 为 用 户 下 单 时 间 的 间隔 。 


概率 回归 模型 COX 模 型 

术 来 35 天 i 未 来 5 天 。 [EE 

古音 [er 是 奉 下 疙 |r Em 
oo rm mm em nm 9 5 mm -~ 
1 rm 站 了 了 1 站 四 mm 
1 ~ We 2 5 a 了 到 
0 站 em 站 ~ WS I ME me 
0 ETFO 记 各 1 a 0 
P(y|x)=f (x) h(t', x)=ho(t" )exp (px) 


1.16 ”流失 预测 模型 


MA 


-39.4 -30.1-1.6-1-=0.4 0.3 0.9 1.5 2 .2.5 7.7 .9.8 


图 1.17 生存 模型 


美 团 做 了 COX 模型 和 概率 回归 模型 的 对 比 。 在 预测 用 户 x X 天 内 是 否 会 下 单 上 面 ， 
两 者 有 相近 的 性 能 。 美 团 外 卖 通过 使 用 用 户 流失 预警 模型 ， 显 著 降低 了 用 户 留 存 的 运营 
成 本 。 


3. 大 数据 在 美 团 外 卖 用 户 补贴 中 的 应 用 


美 团 外 卖 吸引 顾客 的 一 个 方式 是 用 户 补贴 。 用 户 补贴 对 于 平台 而 言 是 一 笔 巨大 的 运营 
成 本 。 但 是 在 很 多 情况 下 ， 用 户 补贴 是 很 有 必要 的 。 平 台 都 希望 吸引 更 多 的 新 用 户 以 及 留 
住 老 客户 ， 这 是 业务 发 展 的 重 中 之 重 。 那 么 ， 怎 样 进行 用 户 补贴 才能 有 助 于 平台 吸引 客 
户 ， 之 后 源源 不 断 地 在 平台 上 消费 ， 这 就 需要 大 数据 分 析 作为 支撑 。 

首先 ， 以 客户 留存 率 和 自动 转化 意愿 将 用 户 群 体 划 分 为 四 个 象限 ( 见 图 1.18)。 第 一 个 
维度 是 客户 留存 率 。 在 互联 网 行业 中 ， 用 户 在 某 段 时 间 内 开始 使 用 应 用 ， 经 过 一 段 时 间 
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后 ， 仍 然 继 续 使 用 应 用 的 被 认 作 是 留存 客户 ， 这 部 分 用 户 占 当 时 新 增 用 户 的 比例 即 是 客户 
留存 率 。 需 要 关注 的 是 ， 对 于 刚 开始 使 用 美 团 外 卖 的 新 用 户 ， 有 多 大 可 能 性 会 一 直 留 在 平 
台 ， 在 平台 不 给 补贴 的 情况 下 ， 还 会 不 会 继续 留 在 平台 。 有 的 用 户 在 只 有 给 红包 的 情况 下 
才 会 留 下 ， 这 就 是 留存 率 低 的 情况 。 另 一 个 维度 是 用 户 的 自动 转化 意愿 。 平 台 上 每 天 都 会 
有 很 多 新 客户 ， 有 的 新 客户 没 使 用 红包 就 开始 使 用 平台 的 服务 ， 有 的 客户 只 有 给 他 发 红包 
才能 完成 转化 ， 但 是 转化 之 后 会 成 为 平台 的 忠实 客户 ， 有 的 客户 一 旦 没有 红包 就 会 自动 流 
失 。 那 么 ， 对 于 自动 转化 意愿 高 的 用 户 ， 不 给 红包 也 愿意 使 用 ， 如 果 能 识别 出 来 这 类 客 
户 ， 就 可 以 不 给 补贴 。 还 有 一 些 只 有 收 到 红包 才 使 用 ， 之 后 又 会 流失 ， 如 图 中 第 三 象限 ， 
这 部 分 用 户 最 好 不 发 补贴 。 平 台 需 要 识别 给 了 红包 就 可 以 一 直 留 在 平台 ， 即 使 以 后 没有 红 
包 也 会 一 直 保 持 消费 忠诚 的 客户 。 要 知道 客户 属于 哪个 象限 的 ， 就 需要 用 大 量 数据 做 
挖掘。 


用 户 留存 率 高 


用 户 留存 率 低 
图 1.18 用 户 群 体 划分 
为 了 识别 不 同类 型 的 用 户 ， 需 要 做 用 户 画 像 ( 见 图 1.19)， 首 先 通过 各 种 渠道 了 解 用 户 
的 年 龄 、 婚 姻 状况 、 收 入 水 平 、 消 费 习惯 、 常 住地 等 ， 了 解 这 些 信 息 后 ， 需 要 做 一 次 用 户 
模型 的 训练 ， 即 把 各 种 参数 跟 四 个 象限 做 一 次 训练 ， 就 知道 给 什么 样 的 用 户 推 红包 。 以 下 
分 析 如 何 使 用 用 户 画 像 来 寻找 补贴 对 象 。 


消费 水 平 收入 水 平 


图 1.19 用 户 画像 要 素 


图 1.20 是 数据 挖掘 的 流程 示意 图 。 美 团 外 卖 也 是 一 个 大 数据 公司 ， 每 天 有 大 量 用 户 浏 
览 网 页 、 大 量 用 户 在 网 站 上 购买 、 用 户 的 位 置 属性 和 手机 型 号 这 些 数据 也 都 可 以 获得 ， 另 
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外 还 有 用 户 自己 填写 的 性 别 、 年 龄 等 ， 这 些 都 可 以 用 来 做 用 户 数据 的 挖掘 。 有 了 这 些 数据 
之 后 ， 通 过 数据 挖掘 的 算法 ， 对 用 户 进行 深入 的 挖掘 之 后 ， 再 去 完善 用 户 的 各 种 画像 ， 就 
可 以 得 到 一 个 模型 。 然 后 对 于 任何 一 个 特定 的 用 户 ， 将 其 浏览 购买 历史 的 信息 输入 模型 
中 ， 就 可 以 知道 这 个 用 户 很 多 具体 的 特征 。 例 如 ， 用 户 的 年 龄 为 25 到 30， 可 能 是 一 个 刚 
毕业 没 多 和 久 的 白领 。 例 如 ， 用 户 是 一 个 夜 猫 子 ， 那 么 平台 就 在 晚上 向 其 推荐 一 些 夜宵 。 再 
比如 ， 单 身 理工 男 ， 他 可 能 就 不 太 喜 欢 甜 食 、 水 果 。 这 就 是 平台 通过 大 数据 挖掘 得 到 的 很 
多 用 户 画像 的 信息 ， 之 后 将 这 些 信 息 用 于 平台 用 户 营销 、 用 户 补贴 等 方面 ， 可 以 快速 提高 
平台 识别 和 分 析 用 户 的 精准 度 。 如 果 理 想 情况 下 ， 把 原来 随便 撒 红 包 的 形式 ， 限 制 在 一 个 
象限 ， 平 台 资金 的 使 用 效率 就 会 更 高 ， 这 就 是 大 数据 在 用 户 补贴 方面 的 使 用 。 


寻找 补贴 对 象 : 用 户 画像 


位 置 : 五 道口 
口味 : 川菜 和 火锅 
消费 型 


图 1.20 用 户 画 像 流程 
4. 大 数据 在 美 团 外 卖 供应 链 中 的 应 用 
“外 卖 020” 是 一 种 特殊 的 02O 形态 ， 多 了 一 个 配送 和 调度 的 部 分 。 其 他 如 信息 发 
布 、 用 户 信息 的 搜索 以 及 支付 和 以 往 都 一 样 ， 只 是 履约 部 分 由 消费 者 到 商家 店 里 消费 改 成 
配送 上 门 。 配 送 团队 首先 报告 给 平台 ， 每 一 个 配送 员 的 位 置 在 什么 地 方 ， 平 台 根据 这 个 定 
位 和 订单 的 信息 发 起 调度 ， 告 诉 配送 员 去 取 哪个 订单 ， 然 后 这 个 配送 员 就 可 以 去 商户 那 边 


把 订单 取 回来 ， 送 给 消费 者 ， 这 是 外 卖 020 的 模式 。 

1) 0O20 闭环 

外 卖 02O 模式 的 真正 价值 在 于 通过 线 上 工具 与 去 服务器 、CRM、 餐饮 管理 系统 的 信 
息 化 无 颖 闭合 回路 ， 依 靠 云 计 算 功 能 处 理 、 转 化 、 应 用 大 数据 。 所 以 ， 只 有 无 颖 整合 线 上 
线 下 资源 ， 形 成 020 闭环 才 是 企业 能 否 踏 入 大 数据 时 代 的 关键 。 外 卖 02O 闭环 的 难点 和 
痛 点 在 于 ， 如 何 收集 线 下 消费 者 体验 的 反馈 信息 ， 并 将 线 下 用 户 引 到 线 上 交流 ， 进 行 线 上 
体验 。 有 的 商家 以 为 自己 促使 消费 者 完成 线 上 的 支付 就 是 02O 闭环 ， 这 是 肤浅 的 想法 。 
把 消费 者 从 线 下 送 到 线 上 ， 这 个 线 上 不 仅仅 是 支付 ， 而 是 要 形成 线 上 的 消费 者 与 消费 者 、 
消费 者 与 商家 之 间 的 互动 。 

互动 需要 一 个 能 够 容纳 消费 者 和 商家 的 平台 。 现 在 看 来 ， 微 信 平 台 是 一 个 不 错 的 选 
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择 。 可 以 在 微 信 上 建立 一 个 公众 平台 ， 与 消费 者 进行 互动 交流 。 互 动 的 话题 可 以 是 让 消费 
者 自己 来 设计 喜欢 的 菜单 ， 让 消费 者 自己 来 设计 喜欢 的 菜品 。 一 旦 得 到 采纳 ， 消 费 者 可 以 
获得 奖品 ， 或 者 是 此 菜品 永远 对 该 设计 者 免费 。 这 样 ， 除 了 在 平台 上 完成 订餐 、 点 菜 、 支 
付 等 功能 外 ， 还 能 根据 消费 者 的 消费 行为 有 针对 性 地 进行 推广 和 促销 。 更 重要 的 是 ， 能 充 
分 发 挥 粉丝 经 济 的 作用 ， 让 粉丝 参与 到 服务 改进 、 菜 品 改进 中 来 ， 提 高 顾客 的 满意 度 并 提 
升 商 家 的 销量 和 形象 。 

自 此 ， 把 消费 者 从 线 下 引 到 线 上 的 途径 就 达成 了 ， 这 样 才 是 一 个 真正 的 O02O 闭环 ( 见 
1.21)。 从 线 上 到 线 下 ， 再 从 线 下 到 线 上 ， 消 费 者 在 被 引导 ， 数 据 和 信息 才 会 流入 商家 的 
口袋 中 。 


“大 数据 库 
线 上 020 平 各 
， 引 | "大 数据 驱动 新 型 团购 模式 
a 动 流 | 大 数据 的 智能 订餐 
线 下 商家 
“优化 门店 布局 
“控制 店内 人 流 


1.21 大 数据 库 02O 闭环 


2) ”配送 的 智能 调度 系统 

如 图 1.22 所 示 为 配送 调度 的 示意 图 ， 黑 色 的 袋鼠 是 配送 员 ( 骑 手 )。 一 般 而 言 ， 平 台 没 
法 预测 用 户 下 单 的 位 置 。 每 个 用 户 下 单 的 频率 不 一 样 ， 下 单 的 餐馆 也 不 一 样 。 这 些 骑 手 站 
位 要 怎么 站 位 ， 这 么 多 订单 要 让 哪个 骑手 取 哪 个 订单 ， 用 什么 顺序 送 这 个 订单 ， 这 些 在 极 
大 程度 上 影响 了 骑手 的 能 效 。 如 图 1.23 所 示 为 配送 要 考虑 的 因素 。 


配送 调度 


图 1.22 美 团 外 卖 配送 调度 图 


40 


大 数据 金融 概述 闫 第 上 过 


外 卖 配送 问题 
将 订单 分 配 至 骑手 
提供 任务 执行 路 线 


j、 下 单 时 间 、 期 望 送 达 时 间 、 商 户 地 址 、 
计 出 餐 时 间 、 调 度 轮 次 。 


.9 、 正 在 执行 的 运单 状况 、 当 前 经 纬度 、 最 
近 一 次 上 报 坐标 时 间 、 当 天 已 完成 的 订单 量 、 骑 手 个 
性 化 因素 (速度 、 评 分 、 接 单 偏好 等 )。 

3. 环境 : 骑手 /商户 /用 户 之 间 的 距离 、 天 气 / 节 假日 、 

当前 总 体 负载 、 未 来 负载 预测 值 、 调 度 类 型 ( 众 包 / 自 

建 /加 盟 ) 


1.23 ”外 卖 配送 问题 
如 果 考 虑 一 个 数学 模型 ( 见 图 1.24)， 目 标 函 数 就 会 优化 很 多 的 变量 ， 比 如 说 每 一 单 了 
均 的 行驶 距离 ， 因 为 平台 根据 这 个 给 配送 员 付 工资 ， 配 送 时 间 ， 这 个 决定 了 用 户 的 体验 ; 
运单 的 准时 率 ， 如 果 订 单 很 多 ， 骑 手 有 限 ， 实 在 送 不 过 来 ， 希 望 最 坏 的 体验 也 不 要 太 坏 ; 
还 有 骑手 的 满意 度 ， 在 平台 技术 团队 看 来 ， 骑 手 也 是 平台 的 客户 ， 所 以 预期 在 分 派 订单 的 
时 候 骑 手 也 是 满意 的 。 
配送 调度 问题 的 数学 模型 


a 


图 1.24 配送 调度 问题 的 数学 模型 


如 图 1.25 所 示 为 美 团 外 卖 现 在 使 用 的 一 套 系统 。 平 台 同样 会 用 很 多 的 特征 数据 来 挖 
据 ， 包 括 给 骑手 画像 ， 即 骑手 的 骑 程 速度 、 送 多 少 ， 他 的 箱子 能 送 什 么 ， 骑 什么 车 送 外 
卖 ， 等 等 。 给 商家 画像 ， 即 这 个 商家 一 天 最 多 出 多 少 单 ， 可 以 做 多 少 盒 外 卖 ， 商 家 从 接 到 
订单 到 准备 好 订单 平均 大 约 几 分 钟 ， 等 等 。 还 有 各 种 配送 指标 ， 包 括 统计 指标 、 骑 手 上 报 
的 各 种 路 径 ， 然 后 都 会 放 在 其 中 进行 挖掘 。 控 掘 之 后 会 结合 所 做 的 一 个 数学 模型 在 一 个 仿 
真 平台 上 运行 ， 运 行 之 后 发 现 这 个 算法 可 以 ， 就 放 到 一 个 实时 的 海量 计算 平台 上 给 实时 的 
这 些 订单 做 实时 调度 。 调 度 算法 是 基于 一 个 多 目标 的 运筹 优化 的 数学 模型 。 在 做 调度 的 过 
程 中 ， 会 同时 监控 每 一 个 订单 ， 监 控 实 际 配送 时 间 跟 预期 的 配送 时 间 是 否 相 同 ， 骑 手 实际 
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走 什么 样 的 路 径 ， 跟 系统 预期 的 最 佳 路 径 是 否 相 同 ， 还 包括 一 些 骑 手 给 平台 反馈 一 些 不 好 
的 调度 方案 等 。 平 台 把 这 些 信息 都 收集 回来 ， 再 输入 到 回放 平台 ， 找 到 那个 时 间 点 再 回放 
一 下 ， 这 样 可 以 指导 这 个 算法 有 什么 地 方 可 以 优化 ， 或 者 需要 添加 哪些 新 的 数据 参数 。 


配送 的 智能 调度 系统 
[数学 建 模 ] 
[实时 调度 计算 ] [多 目标 运筹 优化 ] 
[分 布 式 海量 
计算 平台 ] 


美 团 即 时 智能 调度 [调度 实时 回放 | 
[大 数据 存储 ] 
@@ [实时 数据 处 理 ] 
| 


[ 蝴 手 、 商 家 画像] 
[各 配送 数据 。 芋 下 
指标 统计 控 折 ] 


图 1.25 美 团 外 卖 配 送 的 智能 调度 系统 


这 个 系统 数据 量 特别 大 ， 同 时 包括 骑手 的 数据 ， 十 几 万 骑手 ， 每 十 秒 上 报 一 个 位 置 ， 
所 以 有 特别 多 的 点 。 再 加 上 给 全 国 很 多 城市 做 配送 ， 美 团 专门 跟 气 象 部 门 合作 ， 购 买 了 每 
个 城市 的 实时 气象 数据 ， 然 后 系统 会 根据 气象 数据 知道 城市 的 雨 雪 情 况 ， 根 据 这 个 天 气 情 
况 做 调度 ， 在 这 里 需要 输入 的 数据 特别 多 。 基 于 这 种 情况 ， 平 台 使 用 大 数据 技术 对 配送 的 
调度 方案 进行 不 断 的 探索 和 优化 。 


5. 大 数据 在 扼 制 恶意 刷 单 套 现 中 的 应 用 


有 用 户 补贴 往往 会 带 来 刷 单 作 浆 ,一 般 有 利益 的 地 方 就 容易 产生 这 种 情况 。 刷 单 就 是 
一 种 行业 毒 癌 ， 简 单 来 说 就 是 一 些 作 次 的 订单 和 作 浆 的 交易 。 刷 单 者 有 很 多 不 同 的 目的 
比如 说 用 大 量 虚假 的 订单 套 取 补 贴 的 利率 、 套 现 ， 以 及 制造 一 些 虚 假 的 订单 量 。 例 如 ， 一 
个 店铺 入 驻 美 团 外 卖 之 后 ， 本 来 一 个 月 卖 三 单 五 单 ， 通 过 大 量 的 虚假 订单 ， 一 个 月 一 下 子 
能 有 1000 单 的 销量 。 因 为 美 团 外 卖 网 站 按照 销量 对 商家 进行 排名 ， 通 过 刷 单 把 月 销量 刷 
上 去 ， 店 铺 排名 就 在 上 面 ， 就 会 带 来 更 多 的 流量 ， 这 就 是 制造 虚假 订单 。 还 有 一 部 分 是 利 
用 虚假 订单 写 一 些 虚假 的 评论 来 误导 用 户 。 跟 补贴 相关 的 ， 主 要 是 补贴 套现 。 

与 刷 单行 为 做 斗争 对 O20 行业 的 发 展 是 非常 重要 的 一 件 事情 。 美 团 最 初 的 做 法 ， 是 
在 网 页 上 面 放 了 一 个 链接 ， 让 大 家 举报 刷 单 ， 运 用 群众 的 力量 抑制 刷 单 。 然 而 这 种 方法 没 
有 什么 用 ， 因 为 真正 刷 单 的 人 ， 如 在 家 里 用 “ 猫 池 ” 刷 单 的 人 ， 别 人 是 无 法 知道 的 。 事 实 
证 明 ， 通 过 这 种 方式 接 到 的 举报 很 少 ， 而 接 到 的 举报 经 查 ， 往 往 是 商家 的 一 些 竞争 对 手 为 
了 打击 对 方 的 虚假 举报 。 在 这 种 情况 下 ， 只 有 靠 大 数据 的 技术 手段 才能 抑制 刷 单 ， 如 
图 1.26 所 示 。 


42 


大 数据 全 融 概述 天 第 中间 


防 刷 单 : 依赖 大 数据 技术 手段 


用 户 的 访问 历 

史 、 下 单 历史 

商户 的 销售 

i l. 》 ZO 
录 、 行 驶 路 程 LR 算法 


人 工 训 练 样本 


图 1.26 美 团 外 卖 防 刷 单 模型 


图 1.26 只 是 一 个 简单 的 示意 图 ， 美 团 外 卖 平台 会 收集 大 量 的 数据 ， 包 括 每 个 月 用 户 所 
有 的 下 单 历史 、 浏 览 历史 ， 商 家 的 销售 历史 ， 例 如 一 个 商家 销售 1000 单 ， 这 1000 单 到 底 
是 卖 给 了 一 个 用 户 还 是 卖 给 很 多 个 用 户 ， 这 里 面 可 以 找到 很 多 规律 。 美 团 现在 每 个 订单 都 
是 由 配送 员 配 送 的， 每 个 配送 员 的 APP 要 每 隔 10 秒 汇报 一 次 他 的 地 理 位 置 ， 所 以 平台 有 
所 有 配送 员 的 路 径 记 录 。 同 时 有 一 支 运营 团队 去 人 工分 析 ， 哪 些 订单 是 刷 单 的 ， 有 哪些 特 
征 。 利 用 这 些 人 工 的 样本 作为 种 子 ， 加 上 上 面 的 一 些 数据 ， 同 样 的 把 它们 输入 到 整个 系统 
的 大 数据 库 里 面 。 最 后 有 一 个 防 刷 单 模型 ， 基 于 这 个 刷 单 模型 就 可 以 判断 某 个 用 户 刷 单 的 
可 能 性 和 商家 刷 单 的 可 能 性 。 对 可 能 性 比较 高 的 ， 平 台 运营 人 员 会 介入 并 分 析 ， 如 果 是 真 
的 就 予以 比较 严厉 的 惩罚 ， 情 节 较 轻 就 追 回 刷 单 的 赃款 ， 对 于 情节 较 重 的 行为 将 以 欺诈 的 
罪名 ， 上 报 相 关 法 律 机 构 。 

案例 小 结 : 互联 网 企业 具有 高 速 的 发 展 潜力 ， 互 联网 企业 的 竞争 正在 从 资本 驱动 ， 慢 
慢 走向 技术 驱动 、 数 据 驱 动 。 对 这 些 企 业 而 言 ， 整 体 上 由 原来 的 补贴 导向 的 竞争 ， 慢 慢 变 
成 靠 公司 整体 的 运营 治理 、 技 术 和 数据 导向 的 竞争 。 


本 章 总 结 


@ 大 数据 是 指 在 一 定时 间 范 围 内 无 法 用 传统 数据 库 软 件 进行 采集 、 存 储 、 管 理 和 分 
析 的 数据 集 或 数据 群 ， 需 要 通过 新 的 处 理 模式 才能 体现 出 的 具有 高 效率 的 、 高 价 
值 的 、 海 量 的 、 多 样 化 的 信息 资产 。 大 数据 具有 大 体 量 、 多 样 性 、 时 效 性 、 准 确 
性 、 价 值 性 这 5 个 特征 。 

@ 小 数据 是 以 个 体 为 中 心 ， 需 要 新 的 应 用 方式 才能 体现 出 的 具有 高 价值 的 、 个 体 
的 、 高 效率 的 、 个 性 化 的 信息 资产 。 大 数据 和 小 数据 有 着 本 质 的 区 别 ， 虽 然 两 者 
都 是 以 创造 数据 价值 为 目的 ， 但 是 收集 目的 、 数 据 结构 、 生 命 周期 、 分 析 方 法 及 
分 析 重 点 方面 都 存在 着 不 同 的 定位 。 

e@ 大 数据 的 分 类 形式 众多 。 按 照 大 数据 的 结构 特征 ， 可 以 将 大 数据 分 为 结构 化 数 
据 、 非 结构 化 数据 和 半 结 构 化 数据 。 按 照 大 数据 的 获取 处 理 方式 ， 可 以 将 大 数据 
分 为 批 处 理 数 据 和 流 式 计 算数 据 。 按 照 大 数据 的 处 理 响应 性 能 ， 可 以 将 大 数据 分 
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为 实时 数据 、 非 实时 数据 和 准 实时 数据 ， 按照 大 数据 的 关系 ， 可 以 将 大 数据 分 为 
简单 关系 数据 和 复杂 关系 数据 。 

大 数据 的 处 理 流程 归纳 为 : 首先 利用 多 种 轻型 数据 库 收集 海量 数据 ， 对 不 同 来 源 
的 数据 进行 预 处 理 后 ， 整 合 存储 到 大 型 数据 库 中 ， 然 后 根据 企业 或 个 人 目的 和 需 
求 ， 运 用 合适 的 数据 挖掘 技术 提取 有 益 的 知识 ， 最 后 利用 恰当 的 方式 将 结果 展现 
给 终端 用 户 。 具 体 包括 数据 采集 、 数 据 预 处 理 、 数 据 存 储 、 数 据 挖掘 及 数据 解释 
这 5 个 步骤 。 

大 数据 金融 是 指 运用 大 数据 技术 和 大 数据 平台 开展 金融 活动 和 金融 服务 ， 对 金融 
行业 积累 的 大 数据 以 及 外 部 数据 进行 云 计 算 等 信息 化 处 理 ， 结 合 传统 金融 ， 开 展 
资金 融通 、 创 新 金融 服务 。 

大 数据 金融 与 传统 金融 相 比 ， 存 在 如 下 几 个 方面 的 特点 : 呈现 方式 网 络 化 ， 风 险 
有 所 调整 ,信用 不 对 称 性 大 大 降低 :; 金融 业务 效率 提高 ;金融 企业 服务 边界 扩 
大 ; 产品 是 可 控 的 、 可 接受 的 ， 惠 普 金融 。 相 对 于 传统 金融 ， 大 数据 有 着 无 可 比 
拟 的 优势 : 放贷 快捷 ， 精 准 营销 ， 个 性 化 服务 ; 客户 群体 大 ， 运 营 成 本 低 : 科学 
决策 ， 有 效 风 控 。 

大 数据 给 传统 的 金融 业 、 征 信 业 和 新 兴 的 互联 网 金融 行业 带 来 了 较 大 的 变革 。 与 
此 同时 ， 还 带 来 了 较 大 的 金融 信息 安全 问题 和 监管 挑战 。 因 此 ， 我 们 在 享受 大 数 
据 带 来 的 价值 的 同时 ， 还 应 该 建立 起 完善 的 安全 防范 体系 ， 以 确保 金融 数据 信息 
的 安全 。 

按照 大 数据 服务 所 处 的 环节 ， 可 以 把 大 数据 金融 划分 为 平台 金融 模式 和 供应 链 金 
融 模 式 。 平 台 金 融 模式 是 基于 电 商 平台 基础 上 形成 的 网 上 交易 信息 与 网 上 支付 形 
成 的 大 数据 金融 ， 通 过 云 计算 和 模型 数据 处 理 能 力 而 形成 信用 或 订单 融资 模式 。 
供应 链 金 融 模式 是 企业 利用 自身 所 处 的 产业 链 上 下 游 ， 充 分 整合 供应 链 资源 和 客 
户 资 源 ， 提 供 金 融 服 务 而 形成 的 金融 模式 。 

在 大 数据 背景 下 ， 金 融 信 息 安全 面临 多 方面 的 威胁 ， 包 括 大 数据 集群 数据 库 的 数 
据 安全 威胁 、 智 能 终端 的 数据 安全 威胁 以 及 数据 虚拟 化 带 来 的 泄密 威胁 。 


. 大 数据 的 内 涵 是 什么 ? 与 小 数据 有 什么 区 别 ? 大 数据 有 哪些 特征 ? 
. 大 数据 与 传统 数据 有 哪些 区 别 ? 

. 大 数据 的 价值 体现 在 哪些 方面 ? 

. 大 数据 在 金融 业 中 有 哪些 应 用 ? 

. 大 数据 金融 的 内 涵 和 特点 是 什么 ? 

. 与 传统 金融 相 比 ， 大 数据 金融 有 哪些 优势 ? 

. 大 数据 给 银行 业 、 保 险 业 、 证 券 业 、 征 信 业 分 别 带 来 了 哪些 大 变革 ? 
. 大 数据 金融 在 互联 网 金融 领域 中 有 哪些 应 用 ? 

. 大 数据 金融 信息 存在 哪些 安全 问题 ?如何 解决 ? 
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@ 掌握 大 数据 处 理 流程 : 数据 采集 、 
预 处 理 、 存 储 、 挖 气 和 和 解释 

@ 掌握 大 数据 的 3 种 来 源 : 核心 数 
据 、 外 围 数据 、 常 规 渠道 数据 


@ ”掌握 大 数据 的 主要 架构 
@ ”掌握 数据 挖 气 常 用 方法 


后 本 章 从 大 数据 处 理 流程 、 数 据 来 源 、 大 数据 生态 圈 及 主要 架构 、 数 据 挖 气 的 主 
加 对 要 方法 几 个 方面 来 介绍 大 数据 的 相关 技术 。 


OO 
(CODE 大 数据 处 理 流程 


大 数据 的 处 理 流程 归纳 为 :首先 利用 多 种 轻型 数据 库 收集 海量 数据 ， 对 不 同 来 源 的 数 
据 进 行 预 处 理 后 ， 整 合 存储 到 大 型 数据 库 中 ; 然后 根据 企业 或 个 人 目的 和 需求 ， 运 用 合适 
的 数据 挖掘 技术 提取 有 益 的 知识 ， 最 后 利用 恰当 的 方式 将 结果 展现 给 终端 用 户 。 具 体 包 
括 : 数据 采集 、 数 据 预 处 理 、 数 据 存储 、 数 据 挖掘 及 数据 解释 这 5 个 步 又， 如 图 2.1 所 示 。 


i 名 式 文件 “分 类 分 析 “可视化 技术 


号 回归 分 析 人 机 交互 
网 络 数据 .数据 变换 分 外 式 关联 分 析 
数据 归 约 数据 库 * 聚 类 分 析 
其 他 数据 云 存储 : 序列 分 析 
采集 : 全 4 


2.1 大 数据 的 处 理 流程 


2.1.1 数据 采集 


大 数据 的 采集 是 大 数据 处 理 过 程 中 的 第 一 步 ， 它 是 数据 分 析 和 控 气 的 基础 。 大 数据 的 
采集 是 指 在 确定 用 户 目标 的 基础 上 ， 对 该 范围 内 的 所 有 结构 化 、 半 结构 化 、 非 结构 化 数据 
进行 采集 的 过 程 。 采 集 的 数据 大 部 分 是 瞬时 值 ， 还 包括 某 时 段 内 的 特征 值 。 大 数据 的 主要 
来 源 有 商业 数据 、 互 联网 数据 、 传 感 器 数据 。 针 对 不 同 来 源 的 数据 ， 具 有 不 同 的 采集 广 
法 。 主 要 的 大 数据 采集 方法 有 系统 日 志 采 集 方法 、 网 络 数据 采集 方法 、 其 他 数据 采集 方法 。 

1. 系统 日 志 采 集 方法 


大 多 数 互联 网 企业 都 有 自己 的 海量 数据 采集 工具 ， 常 用 于 系统 日 志 采 集 ， 如 Scribe、 
Flume、Chukwa、Kafka 等 。Scribe 是 Facebook 开源 的 日 志 收 集 系 统 ， 能 够 从 各 种 日 志 源 
收集 日 志 ， 存 储 到 一 个 中 央 存 储 系统 中 ， 以 便于 进行 集中 统计 分 析 和 处 理 ，Chukwa 属于 
Hadoop 系列 产品 ， 是 一 个 大 型 的 分 布 式 系统 监测 数据 的 收集 系统 ， 提 供 了 很 多 模块 以 支持 
Hadoop 集群 分 析 ; Flume 是 cloudera 的 开源 日 志 系统 ， 能 够 有 效 地 收集 汇总 和 移动 大 量 的 
实时 日 志 数据 。 这 些 工 具 均 采用 分 布 式 架构 ， 能 满足 每 秒 数 百 MB 的 日 志 数据 采集 和 传输 
2. 网 络 数据 采集 方法 


网 络 数据 采集 是 指 利用 互联 网 搜索 引擎 技术 从 网 站 抓 取 数 据 信息 。 目 前 ， 网 络 数据 的 
采集 基本 上 是 利用 垂直 搜索 引擎 技术 的 网 络 爬 虫 或 数据 采集 机 器 人 、 分 词 系统 、 任 务 与 索 
引 系统 等 技术 进行 综合 运用 而 完成 。 该 方法 可 以 将 非 结 构 化 数据 从 网 页 中 抽取 出 来 ， 将 其 
存储 为 统一 的 本 地 数据 文件 ， 并 以 结构 化 的 方式 存储 。 它 支持 图 片 、 音 频 、 视 频 等 文件 或 
附件 的 采集 ， 附 件 与 正文 可 以 自动 关联 。 除 了 网 络 中 包含 的 内 容 之 外 ， 对 于 网 络 流量 的 采 
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集 可 以 使 用 DPI 或 DFI 等 带宽 管理 技术 进行 处 理 。 

3. 其 他 数据 采集 方法 

对 于 企业 生产 经 营 数据 或 学 科研 究 数据 等 保密 性 要 求 较 高 的 数据 ， 可 以 通过 与 企业 或 
研究 机 构 合 作 ， 使 用 特定 系统 接口 等 相关 方式 采集 数据 。 

在 大 数据 的 采集 过 程 中 ， 同 一 网 站 同一 时 间 可 能 会 有 很 多 用 户 访 问 和 操作 。 例 如 ， 火 
车 票 售票 网 站 和 淘宝 ， 它 们 并 发 的 访问 量 在 峰值 时 超过 了 上 百 万 ， 并 发 数 十 分 高 。 因 此 ， 
需要 在 采集 端 部 署 大 量 数据 库 才 能 支撑 。 


2.1.2 数据 预 处 理 


由 于 第 一 步 收集 得 到 的 数据 是 原始 数据 ， 存 在 着 不 完整 、 不 一 致 的 问题 ， 无 法 直接 存 
储 到 数据 库 中 进行 数据 挖掘 。 因 此 ， 在 将 来 自前 端的 数据 导入 一 个 集中 的 大 型 数据 库 或 者 
分 布 式 存储 集群 前 ， 需 要 对 大 数据 进行 预 处 理 ， 这 样 不 但 能 够 节约 大 量 的 空间 和 时 间 ， 还 
能 得 到 更 好 的 数据 挖掘 结果 。 大 数据 预 处 理 包 括 对 数据 进行 清理 、 集 成 、 变 换 和 归 约 4 个 
过 程 。 

1. 数据 清理 

数据 清理 是 数据 准备 过 程 中 最 乏味 也 是 最 关键 的 一 步 。 其 目的 是 填补 缺失 的 数据 、 平 
滑 噪 声 数据 、 删 除 元 余数 据 、 纠 正 错误 数据 、 清 除 异 常数 据 ， 将 原始 的 数据 格式 进行 标 
准 化 。 

2. 数据 集成 


数据 集成 是 将 多 个 数据 源 中 的 数据 结合 起 来 并 统一 存储 ， 建 立 数据 仓库 ， 以 更 好 地 解 
决 数据 的 分 布 性 和 异 构 性 问题 。 数 据 集成 技术 的 关键 是 数据 高 速 缓存 器 。 拥 有 一 个 包含 目 
标 计 划 、 源 一 目标 映射 、 数 据 获取 、 分 级 抽取 、 错 误 恢 复 和 安全 性 转换 的 数据 高 速 缓存 
器 ， 可 以 大 大 减少 直接 访问 后 端 系统 和 进行 复杂 实时 集成 的 需求 。 

3. 数据 变换 

数据 变换 是 采用 线性 或 非 线性 的 数学 变换 方法 将 多 维 数据 压缩 成 较 少 维 数 的 数据 ， 消 
除 它们 在 时 间 、 空 间 、 属 性 、 精 度 等 特征 表现 方面 的 差异 。 数 据 变换 可 用 相当 少 的 变量 捕 
获 原始 数据 的 最 大 变化 ， 具 体 变换 方法 的 选择 可 根据 实际 数据 的 属性 特点 而 定 ， 常 见 的 数 
据 变换 方法 有 数据 平滑 、 数 据 聚 焦 、 数 据 规范 化 等 。 

4. 数据 归 约 

数据 归 约 是 指 在 对 数据 挖掘 任务 和 数据 本 身 内容 理 解 的 基础 上 寻找 依赖 于 发 现 目标 的 
数据 的 有 用 特征 ， 以 缩减 数据 规模 ， 从 而 在 尽 可 能 保持 数据 原貌 的 前 提 下 ， 最 大 限度 地 精 
简 数据 量 。 数 据 归 约 主要 有 两 个 途径 : 属性 选择 和 数据 采样 ， 分 别针 对 原始 数据 集中 的 属 
性 和 记录 。 数 据 归 约 技术 可 以 用 来 得 到 数据 集 的 归 约 表示 ， 它 虽然 小 ， 但 仍然 大 致 保持 原 
始 数据 的 完整 性 。 这 样 ， 在 归 约 后 的 数据 集 上 挖掘 将 更 有 效 ， 并 产生 相同 (或 几乎 相同 ) 的 
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分 析 结 果 。 数 据 归 约 的 类 型 主要 有 特征 归 约 、 样 本 归 约 和 特征 值 归 约 。 


2.1.3 数据 存储 


大 数据 种 类 繁多 ， 数 据 结构 化 程度 不 同 ， 传 统 的 结构 化 数据 库 无 法 适应 大 数据 的 存储 
要 求 。 下 面 介绍 3 种 典型 的 大 数据 存储 方案 : 分 布 式 文件 系统 、 分 布 式 数据 库 和 云 存 储 。 


1. 分 布 式 文件 系统 


分 布 式 文件 系统 是 指 文件 系统 管理 的 物理 存储 资源 不 一 定 直接 连接 在 本 地 节点 上 ， 而 
是 通过 计算 机 网 络 与 节点 相连 ， 众 多 的 节点 组 成 一 个 文件 系统 网 络 ， 每 个 节点 可 以 分 布 在 
不 同 的 地 点 ， 通 过 网 络 进行 节点 间 的 通信 和 数据 传输 。 常 见 的 分 布 式 文件 系统 有 GFS、 
HDFS、Lustre、Ceph 等 ， 它 们 各 自 适用 于 不 同 的 领域 ， 其 中 GFS 和 HDFS 最 具有 代表 
性 。GFS 是 Google 公司 设计 的 专用 文件 系统 ， 主 要 用 于 存储 海量 搜索 数据 ， 处 理 大 文 
件 。HDFS 是 Hadoop 分 布 式 文件 系统 ， 它 是 一 种 被 设计 成 适合 运行 在 通用 硬件 上 的 分 布 
式 文件 系统 ， 具 有 高 容错 性 的 特点 。 


2. 分 布 式 数据 库 


分 布 式 数据 库 是 利用 网 络 将 物理 上 分 布 的 多 个 数据 存储 单元 连接 起 来 组 成 的 逻辑 数据 
库 ， 其 基本 思想 是 将 集中 式 数 据 库 中 的 数据 ， 分 散 存储 到 多 个 数据 存储 节点 上 ， 并 通过 网 
络 节 点 连接 起 来 ， 以 获取 更 大 的 存储 容量 和 更 高 的 并 发 访问 量 。 与 传统 的 集中 式 数 据 库 相 
比较 ， 分 布 式 数据 库 具 有 高 扩展 性 、 高 并 发 性 、 高 可 用 性 以 及 更 高 的 数据 访问 速度 。 近 年 
来 ， 随 着 数据 量 的 高 速 增长 ， 传 统 的 关系 型 数据 库 开 始 从 集中 式 模型 向 分 布 式 架构 发 展 ， 
从 集中 式 存 储 走 向 分 布 式 存储 ， 从 集中 式 计算 走向 分 布 式 计算 。 

3. 云 存储 

云 存 储 是 一 种 以 数据 存储 和 管理 为 核心 的 云 计 算 系 统 ， 它 是 指 利用 集群 应 用 、 分 布 式 
文件 和 网 络 技术 系统 等 功能 ， 通 过 应 用 软件 协同 网 络 中 大 量 的 各 种 不 同类 型 的 存储 设备 
共同 建设 一 个 具有 数据 存储 和 业务 访问 功能 的 系统 ， 以 保证 数据 的 安全 性 ， 节 约 存储 空 
间 。 互 联网 技术 的 发 展 是 实现 云 存储 的 基本 条 件 。 通 过 互联 网 技术 ， 云 存储 才能 实现 数 
据 、 文 档 、 图 片 、 音 频 、 视 频 等 内 容 的 存储 和 共享 。 云 存储 系统 结构 主要 由 存储 层 、 基 础 
管理 层 、 应 用 接口 层 、 访 问 层 4 个 部 分 构成 。 


2.1.4 数据 挖掘 


数据 挖掘 是 指 根据 业务 的 需求 和 目的 ， 运 用 合适 的 工具 软件 和 数据 挖掘 方法 对 数据 仓 
库 中 的 数据 信息 进行 处 理 ， 寻 找 出 特定 的 数据 规律 或 数据 模式 ， 得 出 有 价值 的 信息 和 知 
识 。 根 据 信 息 存 储 格式 ， 可 以 把 数据 挖掘 的 对 象 分 为 关系 数据 库 、 面 向 对 象 数据 库 、 数 据 
仓库 、 文 本 数据 源 、 多 媒体 数据 库 、 空 间 数据 库 、 时 态 数据 库 、 异 质数 据 库 以 及 Intemet 
等 。 数 据 挖掘 常用 的 工具 软件 有 : Intelligent Miner、SPSS、SAS、WEKA、Matlab、R 语 
言 、Python 等 。 数 据 挖掘 的 任务 是 从 数据 中 发 现 模式 ， 按 照 数据 挖掘 的 实际 作用 数据 挖掘 
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任务 可 分 为 关联 分 析 、 聚 类 分 析 、 分 类 、 回 归 、 预 测 、 序 列 和 偏差 分 析 。 


2.1.5 数据 解释 


数据 解释 是 一 个 面向 用 户 的 过 程 ， 它 是 指 将 大 数据 挖掘 及 分 析 结 果 在 显示 终端 以 友 
好 、 形 象 、 易 于 理解 的 形式 呈现 给 用 户 。 传 统 的 数据 解释 方法 是 以 文本 形式 输出 结果 或 者 
直接 在 电脑 终端 上 显示 结果 。 大 数据 分 析 的 结果 一 般 是 数据 量 巨大 且 关 系 复杂 的 结果 ， 传 
统 的 分 析 结 果 展 示 方 法 已 基本 不 可 行 。 现 阶段 ， 主 要 是 利用 可 视 化 技术 、 人 机 交互 、 数 据 
起 源 等 新 的 方法 将 结果 展示 给 用 户 ， 帮 助 用 户 更 加 清晰 地 了 解数 据 处 理 后 的 结果 ， 为 用 户 
提供 决策 信息 的 支持 。 目 前 ， 大 部 分 企业 已 经 引进 数据 可 视 化 技术 和 人 机 交互 技术 。 

1. 数据 可 视 化 技术 

数据 可 视 化 技术 主要 是 通过 图 形 化 方法 进行 清晰 、 有 效 的 数据 传递 。 其 基本 思想 是 使 
用 单个 图 元 元 素 表示 数据 库 中 的 每 一 个 数据 项 ， 大 量 的 数据 集 组 成 数据 图 像 ， 并 以 多 维 数 
据 的 形式 表示 数据 的 各 个 属性 值 。 运 用 可 视 化 技术 就 可 以 将 数据 结果 转化 为 静态 或 者 动态 
的 图 形 展示 给 用 户 ， 通 过 交互 手段 抽取 或 者 集成 数据 能 在 画面 中 动态 地 显示 改变 的 结果 。 
这 样 ， 用 户 就 可 以 从 不 同 的 维度 观察 数据 ， 对 数据 进行 更 深入 的 观察 和 分 析 。 可 视 化 技术 
可 以 分 为 5 类 ， 包 括 几 何 技术 、 图 标 技术 、 图 形 技术 、 分 层 技术 、 混 合 技术 。 基 于 不 同 的 
需求 可 以 采取 不 同 的 可 视 化 技术 ， 也 可 以 通过 多 种 技术 手段 来 展示 数据 处 理 结果 。 例 如 ， 
电力 网 络 中 电力 的 传输 ， 为 直观 地 反映 各 个 城市 的 电力 需求 状况 ， 可 以 利用 基于 图 标 技 
术 ， 用 不 同 的 颜色 标明 图 中 各 个 城市 的 电力 负载 情况 。 


2. 人 机 交互 技术 


人 机 交互 技术 是 指 通过 系统 输入 、 输 出 设备 ， 以 有 效 的 方式 实现 人 与 系统 之 间 信息 交 
换 的 技术 。 其 中 ， 系 统 可 以 是 各 类 机 器 、 计 算 机 和 软件 。 用 户 界面 或 人 机 界面 是 人 机 交互 
所 依托 的 介质 和 对 话 接口 ， 通 常 包括 硬件 和 软件 系统 。 人 机 交互 技术 是 一 种 双向 的 信息 传 
递 过 程 ， 既 可 以 由 用 户 向 系统 输入 信息 ， 也 可 以 由 系统 向 用 户 反馈 信息 。 通 过 人 机 交互 技 
术 ， 用 户 只 需要 通过 输入 设备 给 系统 输入 有 关 信 息 、 提 示 、 请 示 等 ， 系 统 就 会 输出 或 通过 
显示 设备 提供 相关 信息 、 回 答 问题 等 。 人 机 交互 技术 能 够 使 得 大 数据 分 析 的 数据 结果 更 好 
地 被 解释 给 用 户 。 这 种 交互 式 的 数据 分 析 过 程 可 以 引导 用 户 逐 步 地 进行 分 析 ， 使 得 用 户 在 
得 到 结果 的 同时 能 够 更 好 地 理解 分 析 结 果 的 由 来 。 与 此 类 似 的 还 有 数据 起 源 技术 ， 通 过 该 
技术 可 以 帮助 用 户 追 溯 整 个 数据 分 析 的 过 程 ， 从 而 有 助 于 用 户 理解 结果 。 


(CO 数据 来 源 


要 做 大 数据 ， 首 先 要 了 解 自己 的 企业 ， 或 者 自己 所 在 的 行业 的 核心 是 什么 。 也 就 是 说 
最 关键 的 企业 需要 找到 自己 的 核心 数据 (价值 )。 只 有 在 这 个 基础 上 ， 建 立 自己 的 大 数据 才 
能 做 一 些 延 伸 。 其 次 ， 要 找到 内 部 的 一 些 外 围 相关 数据 ， 去 慢 慢 地 成 长 它 。 第 一 层 是 核 
心 ; 第 二 层 是 外 围 相关 的 数据 ;第 三 层 是 外 部 机 构 的 一 些 结构 化 数据 ; 第 四 层 是 社会 化 
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的 ， 以 及 各 种 现在 所 谓 的 非 结构 化 的 数据 。 第 一 步 ， 找 到 核心 数据 ， 核 心 数 据 现 在 对 很 多 
企业 来 说 实际 上 就 是 CRM， 自 己 的 用 户 系统 ， 这 是 最 重要 的 。 第 二 步 ， 找 到 外 围 数据 ， 
通过 营销 活动 等 获取 大 量 数 据 。 第 三 步 ， 找 到 常规 渠道 的 数据 ， 这 就 需要 企业 去 找 常规 汇 
道里 面 的 数据 ， 跟 自己 的 CRM 结合 起 来 ， 才 能 为 下 一 步 做 市 场 营销 、 做 推广 、 产 品 创新 
等 建立 基础 。 第 四 步 ， 找 到 外 部 的 社会 化 的 或 者 非 结构 化 的 数据 ， 即 现在 所 谓 的 社会 化 媒 
体 数据 。 这 方面 信息 的 主要 特征 是 非 结构 化 ， 而 且 非 常 庞大 。 

以 金融 企业 为 例 ， 重 点 讨论 金融 企业 的 数据 来 源 、 数 据 现状 ， 企 业 存在 哪些 问题 
以 及 应 该 怎么 应 对 。 


2.2.1 核心 数据 
1. 现状 
金融 企业 的 核心 数据 主要 有 以 下 几 个 来 源 ， 如 图 2.2 所 示 。 


核心 数据 的 主要 来 源 


| ee 


系统 运 | | 非 结构 | 。 | 过 程 广 
易 数据 | 。 | 为 数据 


行 日 志 | 。 | 化 数据 | ”| 档 数据 


2.2 ”数据 来 源 


1) 历史 交易 数据 

按照 主 数据 的 普遍 规划 来 划分 ， 金 融 企业 一 般 拥有 客户 数据 、 交 易 数 据 、 账 户 数据 
等 ， 这 些 数据 有 一 些 已 沉淀 了 多 年 ， 伴 随 着 当年 的 一 些 金融 产品 进入 数据 库 ， 正 处 于 生命 
周期 的 某 一 阶段 。 这 些 数 据 极 具 潜力 价值 ， 通 常 可 以 用 来 促进 精确 营销 、 优 化 产品 设计 等 
分 析 项 目 。 

2) 用户 行为 数据 

企业 每 天 处 理 海量 的 交易 ， 有 相当 一 部 分 交易 是 网 络 上 的 终端 客户 直接 发 起 的 ， 特 别 
是 在 一 些 业务 促销 活动 过 程 中 。 因 此 ， 柜 员 服 务 系 统 、 网 上 服务 系统 中 产生 了 大 量 的 业务 
行为 轨迹 ， 这 些 数 据 通常 可 以 用 来 分 析 提 高 运营 效率 、 促 进 精准 营销 。 

3) ”系统 运行 日 志 

金融 企业 的 应 用 系统 数量 较 多 ， 分 别 负责 完成 各 个 子 领域 的 业务 处 理 与 管理 决策 。 这 
些 应 用 系统 会 产生 大 量 的 数据 库 日 志和 应 用 程序 日 志 。 在 日 常 维护 中 ， 这 些 日 志 的 数量 很 
大 、 价 值 密度 低 ， 并 不 受 重视 。 实 际 上 ， 通 过 日 志 分 析 应 用 系统 效率 ， 是 提高 应 用 系统 服 
务 水 平和 客户 满意 度 的 重要 方法 。 
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4) “ 非 结构 化 数据 

金融 企业 普遍 经 济 实力 雄厚 ， 在 众多 基础 设施 建设 中 投入 了 巨 资 。 因 此 ， 通 过 大 规模 
的 语音 呼叫 中 心 、 邮 件 中 心 、 短 信 中 心 等 客户 接触 渠道 ， 金 融 企业 拥 有 发 布 和 采集 数据 的 
主动 权 。 另 外 ， 不 少 金融 单位 有 着 遍布 全 国 各 行政 辖区 的 客户 服务 大 厅 ， 在 这 里 安装 了 
先进 的 视频 监控 系统 ， 视 频数 据 既 能 起 到 安全 防范 作用 ， 也 能 用 于 分 析 客 户 时 长 等 服务 
类 指标 。 

5) ”过 程 文档 数据 

金融 企业 通常 都 成 立 了 大 规模 的 研发 中 心 和 数据 中 心 ， 按 照 标准 的 流程 开发 和 部 署 应 
用 系统 。 在 这 个 过 程 中 ， 将 产生 大 量 的 需求 分 析 、 设 计 文 档 、 测 试 报告 、 上 线 部 署 、 问 题 
记录 等 过 程 和 技术 文档 。 这 些 文档 是 分 析 和 提升 服务 水 平 的 重要 来 源 。 


2. 问题 


核心 数据 最 大 的 问题 在 于 来 源 多 样 、 流 动 性 差 、 共 享 性 差 。 

1) ”数据 质量 问题 

由 于 某 些 应 用 系统 开发 历史 较 久 ， 随 着 架构 规划 和 科学 技术 的 不 断 进 步 ， 导 致 接口 数 
量 多 、 数 据 不 一 致 、 数 据 质量 差 等 问题 ， 因 此 难以 进行 大 数据 分 析 。 

2) ”内 部 管理 壁 又 

金融 行业 在 开展 大 数据 项 目 获 取 数 据 时 ， 最 严重 的 问题 是 内 部 管理 的 壁垒 。 对 于 许多 
企业 来 说 ， 信 息 流 被 各 部 门 彼此 分 割 ， 数 据 难以 互通 ， 在 这 种 情况 下 ， 大 数据 的 共享 和 汇 
集 变 得 非常 困难 ， 更 难以 实现 大 数据 的 深度 应 用 。 


3. 解决 方法 


数据 作为 一 项 资产 ， 部 门 之 间 数 据 壁垒 的 问题 ， 根 源 不 是 各 部 门 造 成 的 ， 而 是 公司 在 
数据 职责 权利 的 定位 方面 出 现 了 偏差 。 

因此 ， 解 决 此 问题 需要 以 下 几 个 途径 。 

(1) 明确 数据 相关 的 职责 与 归属 。 金 融 企 业 要 明确 : 各 个 渠道 和 部 门 拥有 的 是 数据 采 
集 职责 ， 为 公司 增加 数据 资产 ， 数 据 资产 的 所 有 权 与 使 用 权 ， 只 能 归公 司 所 有 。 

(2) 提升 对 数据 资产 质量 的 认识 。 数 据 资产 至 关 重 要 ， 不 少 金融 企业 依靠 销售 渠道 或 
者 第 三 方 平台 开展 销售 ， 若 客户 资料 质量 很 差 或 者 根本 无 法 获取 ， 就 相当 于 向 公司 提供 了 
伪劣 的 数据 资产 。 

(3) 打通 数据 流转 。 金 融 行业 有 独立 的 研发 中 心 和 数据 中 心 。 其 中 ， 研 发 中 心 负责 程 
序 的 开发 ， 不 得 接触 生产 数据 以 及 未 脱 敏 的 测试 数据 ， 数 据 中 心 负 责 程 序 的 部 署 ， 不 得 接 
触 程序 源码 。 应 用 系统 研发 与 生产 的 剥离 也 可 能 会 加 剧 大 数据 实施 的 难度 。 在 大 数据 这 项 
需要 创新 与 试 错 的 任务 面前 ， 数 据 中 心 作为 数据 的 实际 保有 者 ， 往 往 不 愿意 向 具有 创新 能 
力 的 研发 中 心 提 供 数据 。 因 此 ， 对 大 数据 应 用 来 说 ， 要 确定 真正 具有 创新 实践 能 力 的 组 织 
架构 ， 并 从 决策 管理 层 明确 所 需 的 各 类 支持 必须 到 位 ， 确 立 一 定 的 考核 与 激励 措施 ， 做 到 
利益 均 沾 、 成 果 共享 。 


51 


人 大 数据 金融 与 征 信 


2.2.2 ”外围 数据 


1. 外 围 数据 的 基本 准则 


(1) 符合 法 律 规定 ， 遵 循 道德 规范 。 这 是 一 项 基本 要 求 。 

(2) 在 使 用 外 围 数 据 前 ， 分 析 清 楚 提 供 者 的 商业 模式 ， 如 果 提 供 者 的 商业 模式 会 给 本 
企业 的 未 来 带 来 竞争 关系 ， 那 么 合作 时 需要 仔细 商检 。 

(3) 要 在 购买 与 交换 之 间 权衡 利 次 。 在 数据 所 有 权 不 清晰 的 情况 下 ， 交 换 数 据 是 一 种 
合作 举措 ， 可 以 看 作 是 两 家 单位 以 客户 为 中 心 的 目标 下 开展 的 联合 行为 。 

(4) 外 部 数据 的 目的 是 补充 内 部 数据 ， 转 化 为 企业 数据 资产 。 如 果 企业 已 存在 类 似 的 
内 部 数据 ， 但 因 部 门 利 益 割裂 的 原因 无 法 作为 数据 资产 共享 ， 而 采用 外 购 形式 弥补 ， 那 么 
这 些 外 部 数据 往往 会 变 成 一 个 新 的 分 割 独占 的 数据 ， 同 样 不 能 变 成 企业 级 资产 。 


2. 外 围 数据 来 源 


随 着 数据 资产 地 位 的 逐渐 确立 ， 和 固定 资产 、 知 识 产权 一 样 ， 围 绕 着 数据 的 交易 会 形 
成 新 的 产业 链条 。 不 过 数据 资产 极为 特殊 ， 它 的 价值 会 随 着 交换 与 使 用 而 扩大 ， 这 与 固定 
资产 、 货 币 资产 存在 着 显著 不 同 。 另 外 ， 所 有 权 和 使 用 权 难 以 界定 ， 也 大 大 增加 了 数据 交 
易 的 难度 与 风险 。 

金融 企业 外 围 数据 的 来 源 如 下 。 

1) ”数据 共享 联盟 

对 大 数据 来 说 ， 整 合 和 共享 的 价值 更 大 。 例 如 在 医疗 行业 中 ， 每 一 个 医院 对 于 自己 的 
数据 进行 分 析 ， 需 要 共享 跨 医院 、 跨 地 域 的 医疗 信息 。 未 来 数据 将 呈现 出 共享 的 趋势 ， 数 
据 联盟 成 为 数据 集散 地 之 一 。 
2) ”互联 网 数据 
网 络 息 虫 仍然 是 外 部 数据 的 有 效 获取 途径 ， 因 为 互联 网 有 着 最 大 的 数据 库 。 在 进行 与 
情 监控 时 ， 这 类 数据 来 源 是 不 可 少 的 。 另 外 也 可 以 直接 和 大 型 互联 网 平台 进行 数据 交易 。 

3) ”运营 商 数 据 

例如 ， 在 统计 房屋 空置 率 时 ， 利 用 大 数据 ， 根 据 电力 局 的 智能 电表 数据 、 水 利 局 的 水 
表 走 数 、 邮 局 和 快递 公司 的 针对 该 地 址 的 投递 率 、 通 信 公 司 的 固定 电话 使 用 率 ， 基 本 能 找 
出 哪些 房屋 无 人 居住 。 因 此 ， 金 融 企 业 在 寻找 优质 企业 时 可 以 反 其 道 而 行 之 ， 挖 掘 客户 。 
未 来 各 行业 更 好 地 发 展 的 一 条 捷径 就 是 客户 资源 共享 。 

3. 常见 问题 

1) ”数据 获得 成 本 

金融 企业 数据 是 非常 有 价值 的 一 类 数据 。 数 据 提供 商 最 为 知道 数据 的 价值 ， 因 此 选择 
通过 “购买 加 交换 ”的 形式 提供 数据 。 金 融 企业 需要 评估 可 能 付出 的 成 本 与 代价 。 

2) ”数据 价值 发 挥 

很 多 购买 数据 的 金融 企业 ， 是 由 于 内 部 数据 的 所 有 权 和 使 用 权 不 清晰 而 被 迫 的 行为 。 
在 这 种 情况 下 ， 虽 然 购买 数据 可 以 解决 菜 个 部 门 的 一 时 之 需 ， 但 是 这 些 购 入 的 数据 也 会 陷 
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入 部 门 壁垒 之 中 ， 无 法 最 大 限度 地 发 挥 数 据 的 价值 。 


2.2.3 ”常规 渠道 数据 


在 大 数据 时 代 下 ， 数 据 将 逐步 发 挥 生产 资料 的 作用 ， 数 据 储备 和 数据 分 析 能 力 将 成 为 
未 来 新 兴国 家 最 重要 的 核心 战略 能 力 。 各 地 政府 正在 尝试 由 信息 公开 转向 数据 公开 。 政 府 
开放 数据 着 重 于 政府 主动 开放 大 量 的 、 实 时 的 、 结 构 化 的 数据 和 信息 ， 将 其 在 相关 业务 上 
所 收集 、 整 理 、 产 生 或 者 保有 的 数据 与 信息 ， 主 动 开放 给 其 他 对 象 (包括 社会 组 织 与 公众 ) 
进行 数据 创新 增值 应 用 。 

尽管 受 格 局 、 意 识 、 管 理 水 平 限制 ， 各 地 各 级 政府 的 数据 公开 呈现 出 发 展 迅速 但 明显 
不 均 的 态势 ， 但 是 金融 企业 应 该 做 好 准备 ， 将 公开 数据 资产 转化 为 企业 内 部 的 核心 竞争 
能 力 。 

1. 政府 数据 开放 存在 内 驱动 力 


在 所 有 数据 来 源 中 ， 政 府 通常 掌握 着 最 大 量 的 、 关 键 性 的 数据 和 公共 信息 资源 ， 如 果 
加 大 开发 力度 ， 将 会 极 大 地 推动 政府 办 事 效率 的 提升 和 国家 信息 服务 业 的 发 展 。 

从 政府 对 内 有 效 管理 和 对 外 民生 服务 两 个 层面 上 ， 降 低 行 政 成 本 、 提 高 决策 的 科学 化 
水 平 需 要 高 效 、 实 时 的 信息 系统 ， 而 大 数据 的 支持 是 此 类 信息 系统 有 效 发 挥 作用 的 支柱 之 
一 。 政 府 提供 公共 服务 、 促 进 经济 社 会 发 展 的 职能 发 挥 同样 需要 大 数据 支持 。 政 府 掌 握 了 
大 量 关 于 人 口 、 法 人 和 城市 空间 地 理 等 数据 ， 如 果 要 提供 满足 群众 需求 、 有 针对 性 的 公共 
服务 ， 则 需要 对 所 掌握 的 数据 进行 精细 分 析 。 


2. 政府 公开 数据 的 步骤 


公开 数据 需要 各 级 政府 出 台 更 多 具有 可 操作 性 的 细则 和 措施 。 相 应 部 门 应 制定 由 政府 
或 者 行业 协会 牵头 的 整合 数据 标准 。 定 义 政府 开放 数据 的 最 小 数据 集 ， 从 最 小 数据 集 方面 
来 控制 收集 、 扩 大 开放 。 然 后 要 制定 开放 数据 的 相关 法 规 ， 界 定 哪些 数据 可 以 开放 ， 因 为 
开放 数据 有 成 本 ， 要 开放 那些 最 有 用 、 需 求 量 最 大 的 数据 。 最 后 ， 还 要 加 大 数据 开放 所 带 
来 的 价值 分 析 和 评估 ， 研 究 持续 开放 的 政策 。 


3. 金融 行业 积极 参与 政府 数据 开放 的 过 程 


首先 ， 政 府 数据 公开 需要 一 整套 的 完整 规划 、 顶 层 设计 和 系统 建设 ， 人 贯穿 信 息 收 集 、 
整理 、 存 储 、 发 布 、 服 务 等 全 过 程 ， 内 容 包 括 信息 网 络 、 应 用 系统 、 信 息 的 采集 和 发 布 及 
相关 的 管理 体制 、 程 序 、 实 施 模式 和 项 目 管理 等 。 其 次 ， 政 府 公 开 数 据 在 不 同 部 门 、 不 同 
层级 、 不 同 领域 、 不 同行 业 之 间 的 分 享 、 交 换 、 整 合 还 存在 很 多 问题 ， 想 要 建成 统一 的 数 
据 平台 ， 还 需要 做 很 多 工作 。 最 后 ， 对 大 数据 产业 而 言 ， 政 府 公 开 数据 的 管理 、 整 合 及 挖 
掘 ， 也 是 具有 广阔 前 景 的 业务 发 展 方向 。 

金融 行业 应 秉承 社会 和 政治 责任 ， 发 挥 资金 、 网 点 、 技 术 优势 ， 积 极 参与 到 政府 的 数 
据 开 放 的 过 程 中 ， 以 政府 为 导向 ， 帮 助 建立 起 公共 数据 服务 平台 ， 将 能 够 为 自身 和 行业 的 
健康 有 序 发 展 起 到 非常 重要 的 基础 作用 。 
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(区 大 数据 架构 


基于 上 述 大 数据 的 特征 ， 通 过 传统 IT 技术 存储 和 处 理 大 数据 成 本 高 昂 。 一 个 企业 要 
大 力 发 展 大 数据 应 用 首先 需要 解决 两 个 问题 : 一 是 低 成 本 、 快 速 地 对 海量 、 多 类 别 的 数据 
进行 抽取 和 存储 ; 二 是 使 用 新 的 技术 对 数据 进行 分 析 和 挖掘 ， 为 企业 创造 价值 。 因 此 ， 大 
数据 的 存储 和 处 理 与 云 计 算 技 术 密 不 可 分 ， 在 当前 的 技术 条 件 下 ， 基 于 分 布 式 系统 的 
Hadoop， 被 认为 是 最 适合 处 理 大 数据 的 技术 平台 。Hadoop 提供 的 功能 : 利用 服务 器 集 
群 ， 根 据 用 户 的 自 定义 业务 逻辑 ， 对 海量 数据 进行 分 布 式 处 理 。 广 义 上 来 说 ，Hadoop 通常 
是 指 一 个 更 广泛 的 概念 一 一 Hadoop 生态 圈 。Hadoop 生态 圈 如 图 2.3 所 示 。 
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各 组 件 简介 如 下 。 
1. 主要 模块 


(1) HDFS: 分 布 式 文件 系统 。 

(2) MAPREDUCE: 分 布 式 运算 程序 开发 框架 ， 用 于 大 规模 数据 集 的 并 行 计算 。 

(3) HBASE: 基于 Hadoop 的 分 布 式 海量 数据 库 ， 可 以 将 结构 化 数据 文件 映射 为 数据 
库 表 ， 并 提供 常用 的 SQL 支持 。Hive 查询 引擎 将 SQL 语句 转化 为 Hadoop 平台 的 
MapReduce 任务 运行 。 

2. 数据 管道 


(1) Sqoop: 主要 用 于 跟 关系 数据 库 进行 数据 交互 ， 通 过 JDBC 方式 实现 数据 迁移 。 
(2) Flume: Cloudera 提供 的 日 志 收 集 框架 ， 用 于 将 海量 日 志 数 据 并 行 导 入 HDFS 或 
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者 Hive 中 。 

(3) DistCp: 一 般 用 于 在 两 个 HDFS 集群 中 传输 数据 ， 但 目前 此 命令 只 支持 同 版 本 下 
集群 数据 迁移 ， 主 要 用 于 冷 热 数 据 迁移 、 测 试 等 场景 。 

(4) Scribe: Facebook 开源 的 日 志 收 集 系统 ， 它 能 够 从 各 种 日 志 源 上 收集 日 志 ， 存 储 
到 一 个 中 央 存 储 系 统 ( 可 以 是 NFS， 分 布 式 文件 系统 等 ) 上 ， 以 便于 进行 集中 统计 分 析 处 
理 。 它 为 日 志 的 “分 布 式 收集 ， 统 一 处 理 ” 提 供 了 一 个 可 扩展 的 、 高 容错 的 方案 。 


3. 数据 分 析 


(1) Hive: 提供 了 一 套 类 数据 库 的 数据 存储 和 处 理 机 制 ， 并 采用 HQL (类 SQL ) 语 言 
对 这 些 数 据 进行 自动 化 管理 和 处 理 。Hive 中 的 海量 结构 化 数据 被 看 成 一 个 个 的 表 ， 而 实际 
上 这 些 数 据 是 分 布 式 存储 在 HDFS 中 的 。 注 意 ，Hive 是 离线 查询 工具 ， 由 于 其 内 部 机 制 ， 
需要 把 SQL 转换 成 MapReduce 后 进行 分 布 式 查询 ， 所 以 最 短 查 询 时 间 也 需要 十 几 秒 ， 适 
用 于 海量 数据 场景 ， 不 适合 即时 查询 需求 。 

(2) Impala: Impala 是 Google Dremel 的 Java 实现 版 本 之 一 。Dermel 由 Google 设计 
开发 ， 最 显著 的 特性 就 是 支持 SQL 方式 在 秒 级 别 分 析 TB 级 别 数据 (1TB 数据 3 秒 完成 分 
析 计 算 )。Impalal.0 版 本 完全 兼容 SQL92 规范 ， 不 同 于 Hive 将 SQL 转换 为 MapReduce 方 
式 ，Impala 通过 与 商用 并 行 关 系数 据 库 中 类 似 的 分 布 式 查询 引 框架 (由 Query Planner、 
Query Coordinator 和 Query Exec Engine 三 部 分 组 成 ， 与 MR 相似 的 技术 架构 ， 但 即时 性 更 
好 )， 可 以 直接 从 HDFS 或 者 HBase 中 用 SELECT、JOIN 和 统计 函数 查询 数据 ， 性 能 是 
Hive(0.81) 的 3 一 90 倍 ， 目 前 刚 发 布 的 Hivel.0 在 原 有 性 能 上 有 很 大 提升 ， 都 属于 数据 仓库 
工具 ， 但 Impala 架构 更 先进 。 

(3) Pig: Apache Pig 是 一 个 分 析 大 规模 数据 集 的 平台 ， 其 使 用 场景 和 Hive 相似 ， 
Hive 更 简单 ， 使 用 类 SQL 进行 数据 分 析 ，Pig 使 用 脚本 语言 ， 编 程 性 更 强 ， 有 具体 选择 主要 
依靠 程序 员 的 熟悉 程度 及 场景 复杂 度 决定 。 

(4) Mahout: 主要 用 于 并 行 数据 挖掘 ， 该 框架 对 目前 主流 数据 挖掘 算法 都 已 经 基于 
MapReduce 进行 了 实现 ， 节 省 很 多 额外 开发 时 间 。 如 推荐 引擎 、 用 户 关系 引擎 、GiS 热点 
聚 类 都 可 以 基于 此 框架 算法 来 实现 。 

(5) Scalding: 使 用 Scala 编程 语言 封装 MapReduce 编程 模型 ， 支 持 DSL(domain- 
specific language) 语 法 编程 ， 易 用 性 大 大 提升 。 主 要 用 于 高 并 发 简单 ETL 处 理 场景 。 


4. 任务 调度 


(D oozie: 其 作用 就 是 将 多 个 MapReduce 作业 连接 到 一 起 ， 作 为 一 个 工作 流程 执 
行 。 一 般 情况 下 ， 一 个 大 型 任务 由 多 个 MapReduce 组 成 。 如 果 不 用 Oozie， 需 要 手动 编写 
大 量 连接 和 转换 代码 ， 用 于 串联 起 多 个 MR 任务 流程 ， 比 较 耗 时 ， 出 错 率 和 维护 率 也 比较 
高 。Oozie 通过 xml 方式 配置 连接 起 整个 任务 流程 。 与 传统 工作 流 引 擎 作用 相似 。 

(2) Azkaban: 美国 知名 互联 公司 Linkedin 发 布 的 开源 产品 ， 属 于 Oozie 的 同类 产 
品 ， 在 细节 上 有 区 别 。 
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的 安装 。 另 外 ，Hue 具备 简单 的 权限 和 用 户 管理 功能 ， 这 是 其 他 开源 UI 不 具备 的 。 

Hadoop 是 一 个 分 布 式 的 基础 架构 ， 能 够 让 用 户 方便 高 效 地 利用 运算 资源 和 处 理 海量 数 
据 ， 目 前 已 在 很 多 大 型 互联 网 企业 得 到 了 广泛 应 用 ， 如 亚马逊 、Facebook、Yahoo 等 。 它 
是 一 个 开放 式 的 架构 ， 架 构成 员 也 在 不 断 扩充 完善 中 。 

Hadoop 是 一 个 开发 和 运行 处 理 大 规模 数据 的 软件 平台 ， 属 于 Apache 开源 组 织 ， 用 
Java 语言 开发 ， 用 于 实现 在 大 量 计算 机 组 成 的 集群 中 对 海量 数据 进行 分 布 式 存 储 和 计算 。 
Hadoop 最 核心 的 设计 包含 两 个 模块 : HDFS 和 MapReduce。 其 中 HDFS 提供 海量 数据 的 存 
储 ，MapReduce 提供 海量 数据 的 分 布 式 计 算 能 


2.3.1 HDFS 系统 


1. HDFS 系统 的 概念 和 特性 


首先 ，HDFS 系统 是 一 个 文件 系统 ， 用 于 存储 文件 ， 通 过 统一 的 命名 空间 一 一 目录 树 
来 定位 文件 。 其 次 ，HDFS 系统 是 分 布 式 的 ， 由 很 多 服务 器 联合 起 来 实现 其 功能 ， 集 群 中 
的 服务 器 有 各 自 的 角色 。 

HDFS 系统 在 大 数据 中 的 应 用 是 为 各 类 分 布 式 运算 框架 提供 数据 存储 服务 ， 将 大 文 
件 、 大 批量 文件 ， 分 布 式 存放 在 大 量 的 服务 器 上 ， 以 便于 采取 分 而 治之 的 方式 对 海量 数据 
进行 运算 分 析 。 

HDFS 系统 的 特性 如 下 。 

(1) 有 高 容错 性 的 特点 。 

(2) 整个 系统 部 署 在 低廉 的 硬件 上 。 

(3) 提供 高 传输 率 来 访问 应 用 程序 的 数据 。 

(4) 适合 超大 数据 集 的 应 用 程序 。 

(5) 流 式 数据 访问 。 

HDFS 本 身 是 软件 系统 ， 不 同 于 传统 硬盘 和 共享 存储 介质 ， 在 文件 操作 上 有 其 不 同 
之 处 。 

(1) 不 支持 文件 随机 写 入 。 支 持 随机 读 ， 但 没有 随机 写 入 机 制 ， 这 与 HDFS 文件 写 入 
机 制 有 关 ， 所 以 不 支持 断 点 续 传 等 功能 。 

(2) 需要 客户 端 与 HDFS 交互 。 目 前 已 有 开源 支持 HDFS mount 到 Linux 服务 器 上 ， 
但 性 能 非常 不 好 。 

(3) 适合 大 文件 读 取 场 景 。 因 为 其 分 块 宛 余 存 储 机 制 ， 其 存储 架构 在 处 理 小 于 其 分 块 
文件 大 小 的 文件 时 ， 会 浪费 管理 节点 资源 ， 导 致 效率 低 。 

(4) 吞吐 和 并 发 具备 横向 扩展 能 力 。 单 节点 系统 比 传统 硬盘 效率 低 很 多 ， 但 在 大 量 机 
器 集群 环境 下 ， 其 吞吐 和 并 发 能 力 可 以 线性 提升 ， 远 远 高 于 单一 硬件 设备 。 

(5) 不 适合 高 响应 系统 。 由 于 HDFS 是 为 高 数据 吞吐 量 应 用 而 设计 的 ， 以 高 延迟 为 
代价 。 

2. HDFS 的 结构 


HDFS 中 有 3 个 重要 角色 : NameNode、DataNode 和 Client， 如 图 2.4 所 示 。 
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2.4 HDFS 结构 


对 外 部 客户 机 而 言 ，HDFS 就 像 一 个 传统 的 分 级 文件 系统 ， 可 以 删除 、 移 动 或 重 命名 
文件 等 。 但 是 HDFS 架构 是 基于 一 组 特定 的 节点 构建 的 ， 这 是 由 它 自身 的 特点 决定 的 。 这 
些 节点 包括 NameNode( 仅 1 个 )， 它 在 HDFS 内 部 提供 元 数据 服务 ，DataNode 为 HDFS 提 
供 存 储 块 。 

存储 在 HDFS 中 的 文件 被 分 成 块 ， 然 后 将 这 些 块 复制 到 多 台 计算 机 中 (DataNode)。 这 
与 传统 的 RAID 架构 大 不 相同 。 块 的 大 小 (通常 为 64MB) 和 复制 的 块 数量 在 创建 文件 时 由 客 
户 机 决定 。NameNode 可 以 控制 所 有 文件 操作 。HDFS 内 部 的 所 有 通信 都 基于 标准 的 
TCP/IP 协议 。 

1) NameNode 

NameNode 是 一 个 通常 在 HDFS 实例 中 的 单独 机 器 上 运行 的 软件 。 它 负责 管理 文件 系 
统 名 称 空间 和 控制 外 部 客户 机 的 访问 。NameNode 决定 是 否 将 文件 映射 到 DataNode 上 的 复 
制 块 上 。 对 于 最 常见 的 3 个 复制 块 ， 第 一 个 复制 块 存储 在 同一 机 架 的 不 同 节 点 上 ， 最 后 一 
个 复制 块 存储 在 不 同 机 架 的 某 个 节点 上 。Metadata 所 有 的 相关 服务 都 是 由 NameNode 提 
供 ， 包 括 filename->block (namespace)， 以 及 block->DataNode 的 对 应 表 。 其 中 ， 前 者 通过 
FsImage 写 入 本 地 文件 系统 中 ， 而 后 者 是 通过 每 次 HDFS 启动 时 ，DataNode 进行 
blockreport 后 在 内 存 中 重 构 的 数据 结构 。 

实际 的 IO 实务 并 没有 经 过 NameNode， 只 有 表示 DataNode 和 块 的 文件 映射 的 元 数据 
经 过 NameNode。 当 外 部 客户 机 发 送 请 求 要 求 创建 文件 时 ，NameNode 会 以 块 标识 和 该 块 
的 第 一 个 副本 的 DataNode 的 了 P 地 址 作为 响应 。 这 个 NameNode 还 会 通知 其 他 将 要 接收 该 
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块 的 副本 的 DataNode。 

NameNode 在 一 个 称 为 FsImage 的 文件 中 存储 所 有 关于 文件 系统 名 称 空间 的 信息 。 这 
个 文件 和 一 个 包含 所 有 事务 的 记录 文件 (EditLog) 将 存储 在 NameNode 的 本 地 文件 系统 上 。 
FsImage 和 EditLog 文件 也 需要 复制 副本 ， 以 防 文件 损坏 或 NameNode 系统 走失 。 

2) DataNode 

DataNode 也 是 一 个 通常 在 HDFS 实例 中 的 单独 机 器 上 运行 的 软件 。Hadoop 集群 中 包 
含 一 个 NameNode 和 大 量 DataNode。DataNode 通常 以 机 架 的 形式 组 织 ， 机 架 通过 一 个 交 
换 机 将 所 有 系统 连接 起 来 。 

DataNode 响应 来 自 HDFS 客户 机 的 读 写 请 求 。 并 且 还 响应 来 自 NameNode 的 创建 、 删 
除 和 复制 块 的 命令 。NameNode 依赖 来 自 每 个 DataNode 的 定期 心跳 (Heartbeat) 消 息 。 每 条 
消息 都 包含 一 个 块 报告 ， NameNode 可 以 根据 这 个 报告 验证 块 映射 和 其 他 文件 系统 元 数据 。 

分 布 式 文件 存储 的 数据 节点 ， 存 储 着 文件 块 (Block)， 而 文件 是 由 文件 块 组 成 的 ， 每 个 
块 存储 在 多 个 (可 配 ， 默 认为 3) 不 同 的 DataNode 可 以 提高 数据 的 可 靠 性 。 

如 果 客 户 机 想 将 文件 写 到 HDFS 上 ， 首 先 需 要 将 文件 缓存 到 本 地 的 临时 存储 区 。 如 果 
缓存 的 数据 大 于 所 需 的 HDFS 块 大 小 ， 创 建文 件 的 请 求 将 发 送 给 NameNode。NameNode 
将 以 DataNode 标识 和 目标 块 响应 客户 机 。 同 时 也 通知 将 要 保存 文件 块 副本 的 DataNode。 
当 客 户 机 开始 将 临时 文件 发 送 给 第 一 个 DataNode 时 ， 将 立即 通过 管道 方式 将 块 方式 内 容 
转发 副本 DataNode。 客 户 机 也 负责 创建 保存 在 相同 HDFS 名 称 空间 中 的 校 验 文 件 。 在 最 后 
的 文件 块 发 送 后 ，NameNode 将 文件 创建 提交 到 它 的 持久 化 数据 存储 (EditLog 和 FsImage 
文件 )。 

3) Client 

用 于 实现 客户 端 文 件 存储 的 所 有 操作 ， 包 括 文件 的 增删 以 及 查询 等 。 


3. HDFS 文件 写 入 与 读 取 


HDFS 文件 的 写 入 流程 如 图 2.5 所 示 。 

(1) 客户 端 通过 Distributed FileSystem 上 的 create() 方 法 指明 一 个 欲 创建 的 文件 的 文件 
名 ， 然 后 client 通过 RPC 方式 与 NameNode 通信 创建 一 个 新 文件 映射 关系 。 

(2) 客户 端 写 数据 : FSData OutputStream 把 写 入 的 数据 分 成 包 (packet)， 放 入 一 个 中 间 
队列 一 一 数据 队列 (data queue) 中 去 。OutputStream 从 数据 队列 中 取 数 据 ， 同 时 向 
NameNode 申请 一 个 新 的 block 来 存放 它 已 经 取得 的 数据 。NameNode 选择 一 系列 合适 的 
DataNode( 个 数 由 文件 的 replication 数 决 定 ， 默 认为 3， 构 成 一 个 管道 线 (pipeline)， 所 以 管 
道 线 中 就 有 3 个 DataNode 。OnutputStream 把 数据 流 式 地 写 入 到 管道 线 中 的 第 一 个 
DataNode 中 ， 第 一 个 DataNode 再 把 接收 到 的 数据 转 到 第 二 个 DataNode 中 ， 以 此 类 推 。 

(3) FSData OutputStream 同时 也 维护 着 另 一 个 中 间 队 列 一 一 确认 队列 (ack queue)， 确 
认 队 列 中 的 包 只 有 在 得 到 管道 线 中 所 有 的 DataNode 的 确认 以 后 才 会 被 移出 确认 队列 。 

(4) 所 有 文件 写 入 完成 后 ， 关 闭 文 件 写 入 流 。 
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pipeline of 
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2.5 ”HDFS 文件 的 写 入 流程 


从 以 上 文件 写 入 流程 ， 可 以 总 结 出 HDFS 文件 写 入 具备 如 下 特性 。 
@ 响应 时 间 比 较 长 。 

@ ”文件 写 入 效率 与 block 块 数 和 集群 数量 相关 。 

HDFS 文件 的 读 取 流程 如 图 2.6 所 示 。 


2:get block 
locations 


NameNode 


namenode 


client JVM 
client node 


DataNode DataNode DataNode 


2.6 ”HDFS 文件 的 读 取 流程 


(1) 打开 文件 流 (open()。 

(2) 从 NameNode 读 取 文件 块 位 置 列表 。 
(3) FSDataInputSteam 打开 read() 方法 。 
(4) 根据 文件 块 与 DataNode 的 映射 关系 。 
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(5) 从 不 同 的 DataNode 中 并 发 读 取 文 件 块 。 

(6) 文件 读 取 完毕 ， 关 闭 input 流 。 
因为 元 余 机 制 ， 当 HDFS 文件 读 取 压力 比较 大 的 时 候 ， 可 以 通过 提高 多 余数 的 方式 ， 
NameNode 可 以 通过 轮 询 方式 ， 分 配 不 同 client 访问 不 同 DataNode 上 的 相同 文件 块 ， 提 升 
整体 吞吐 率 。 

Hadoop 在 创建 新 文件 时 是 如 何 选择 block 的 位 置 的 呢 ， 综 合 来 说 ， 要 考虑 带宽 (包括 

写 带 宽 和 读 带 宽 ) 和 数据 安全 性 ， 如 图 2.7 所 示 。 


Tack 


data center 


2.7 选择 block 的 位 置 


如 果 把 3 个 备份 全 部 放 在 一 个 DataNode 上 ， 虽 然 可 以 避免 写 带宽 的 消耗 ， 但 几乎 没 
有 提供 数据 元 余 带 来 的 安全 性 ， 如 果 这 个 DataNode 宕 机 ， 那 么 这 个 文件 的 所 有 数据 就 全 
部 丢失 了 。 另 一 个 极端 情况 是 ， 如 果 把 3 个 元 余 备 份 全 部 放 在 不 同 的 机 架 上 ， 甚 至 数据 中 
心里 面 ， 虽 然 这 样 做 数据 很 安全 ， 但 写 数据 会 消耗 很 多 的 带宽 。HDFS 提供 了 一 个 默认 备 
份 分 配 策略 : 把 第 一 个 备份 放 在 与 客户 端 相同 的 DataNode 上 ， 第 二 个 放 在 与 第 一 个 不 同 
机 架 的 一 个 随机 DataNode 上 ， 第 三 个 放 在 与 第 二 个 相同 机 架 的 随机 DataNode 上 。 如 果 备 
份 数 大 于 3， 则 随后 的 备份 在 集群 中 随机 存放 ，Hadoop 会 尽量 避免 过 多 的 备份 存放 在 同一 
个 机 架 上 。 


2.3.2 MapReduce 


MapReduce 是 Google 提出 的 并 行 计 算 架 构 ， 用 于 大 规模 数据 集 (TB 级 以 上 ) 的 并 行 运 
算 。 此 算法 的 计算 能 力 ， 随 着 计算 节点 的 数量 增加 而 线性 上 升 。 

图 2.8 表示 一 个 MapReduce 计算 处 理 思路 ， 可 以 简要 分 解 为 两 部 分 ， 数 据 分 块 映射 处 
理 (Map) 和 数据 结果 聚合 (Reduce) 两 个 步骤 ， 源 数据 可 以 存储 在 HDFS 或 者 第 三 方 数据 源 
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上 ， 计 算 过 程 临时 数据 存储 在 HDFS 和 内 存 中 ， 最 终 获 得 我 们 需要 的 计算 结果 ， 其 具体 处 
理 流程 如 图 2.9 所 示 。 
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2.9 MapReduce 计算 处 理 流程 
1. Map 端 


(1) 每 个 输入 分 片 会 让 一 个 Map 任务 来 处 理 ， 默 认 情 况 下 ， 以 HDFS 的 一 个 块 的 大 小 
(默认 为 64MB) 为 一 个 分 片 ， 当 然 我 们 也 可 以 自行 设置 块 的 大 小 。Map 输出 的 结果 会 暂时 
放 在 一 个 环形 内 存 缓冲 区 中 (该 缓冲 区 的 大 小 默认 为 100MB)， 当 该 缓冲 区 快要 溢出 时 (默认 
为 缓冲 区 大 小 的 809%6)， 会 在 本 地 文件 系统 中 创建 一 个 溢出 文件 ， 将 该 缓冲 区 中 的 数据 写 入 
这 个 文件 。 

(2) 在 写 入 磁盘 之 前 ， 线 程 首先 根据 Reduce 任务 的 数目 将 数据 划分 为 相同 数目 的 分 
区 ， 也 就 是 一 个 Reduce 任务 对 应 一 个 分 区 的 数据 。 这 样 做 是 为 了 避免 有 些 Reduce 任务 分 
到 大 量 数据 ， 而 有 些 Reduce 任务 却 分 到 很 少数 据 ， 甚 至 没有 分 到 数据 的 篮 欣 局 面 。 其 实 
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分 区 就 是 对 数据 进行 Hash 的 过 程 。 然 后 对 每 个 分 区 中 的 数据 进行 排序 ， 如 果 此 时 设置 了 
Combiner， 将 排序 后 的 结果 进行 Map 合并 操作 ， 这 样 做 的 目的 是 让 尽 可 能 少 的 数据 写 入 
人 磁盘。 

(3) 当 Map 任务 输出 最 后 一 个 记录 时 ， 可 能 会 有 很 多 溢出 文件 ， 这 时 需要 将 这 些 文件 
合并 。 合 并 的 过 程 中 会 不 断 地 进行 排序 和 合并 操作 ， 目 的 有 两 个 : 尽量 减少 每 次 写 入 磁 
盘 的 数据 量 ， 名 尽量 减少 下 一 复制 阶段 网 络 传输 的 数据 量 。 最 后 合并 成 了 一 个 已 分 区 且 已 
排序 的 文件 。 为 了 减少 网 络 传输 的 数据 量 ， 可 以 将 数据 压缩。 

(4) 将 分 区 中 的 数据 复制 给 相对 应 的 Reduce 任务 。Map 任务 一 直 和 其 父 TaskTracker 
保持 联系 ， 而 TaskTracker 又 一 直 和 JobTracker 保持 心跳 。 所 以 JobTracker 中 保存 了 整个 
集群 中 的 宏观 信息 。Reduce 任务 只 需 向 JobTracker 获取 对 应 的 Map 输出 位 置 。 


2. Reduce 端 


(1) Reduce 会 接收 到 不 同 的 Map 任务 传 来 的 数据 ， 并 且 每 个 Map 传 来 的 数据 都 是 有 
序 的 。 如 果 Reduce 端 接收 的 数据 量 相当 小 ， 则 直接 存储 在 内 存 中 ， 如 果 数 据 量 超过 了 该 
缓冲 区 大 小 的 一 定 比 例 ， 则 对 数据 合并 后 溢 写 到 磁盘 中 。 

(2) 随 着 溢 写 文件 的 增多 ， 后 台 线 程 会 将 它们 合并 成 一 个 更 大 的 有 序 的 文件 ， 这 样 做 
是 为 了 给 后 面 的 合并 节省 时 间 。 其 实 不 管 在 Map 端 还 是 Reduce 端 ，MapReduce 都 是 反复 
地 执行 排序 、 合 并 操作 ， 这 就 是 为 什么 有 些 人 会 说 : 排序 是 Hadoop 的 灵魂 。 

(3) 合并 的 过 程 中 会 产生 许多 中 间 文 件 ( 写 入 磁盘 了 )， 但 MapReduce 会 让 写 入 磁盘 的 
数据 尽 可 能 地 少 ， 并 且 最 后 一 次 合并 的 结果 并 没有 写 入 磁盘 ， 而 是 直接 输入 到 Reduce 
函数 。 

3. Shuffle 


在 Hadoop 的 集群 环境 中 ， 大 部 分 Map 任务 和 Reduce 任务 是 在 不 同 的 Node 上 执行 ， 
主要 的 开销 是 网 络 开 销 和 磁盘 IO 开销 ， 因 此 Shuffle 的 主要 作用 如 下 。 

(1) 完整 地 从 Map 端 传输 到 Reduce 端 。 

(2) 跨 节点 传输 数据 时 ， 尽 可 能 减少 对 带宽 的 消耗 (注意 是 Reduce 执行 的 时 候 去 拉 取 
Map 端的 结果 )。 

(3) 减少 磁盘 IO 开销 对 任务 的 影响 。 


2.3.3 HBase 


HBase 是 Google Bigtable 的 开源 实现 版 本 。 数 据 存储 在 HDFS 中 ， 继 承 了 HDFS 的 高 
可 靠 性 、 可 伸缩 架构 ， 同 时 自己 实现 了 高 性 能 、 列 存储 、 实 时 读 写 的 特性 。 

不 同 于 HDFS 的 高 吞吐 低 响 应 ，HBase 设计 用 于 高 并 发 读 写 场景 。 

(1) HBase 基于 Hadoop HDFS append 方式 进行 数据 追加 操作 ， 非 常 适合 列 族 文件 存 
储 架 构 。 

(2) HBase 写 请 求 ， 都 会 先 写 redo log， 然 后 更 新 内 存 中 的 缓存 。 缓 存 会 定期 地 刷 入 
HDFS。 文件 基于 列 创建 ， 因 此 任何 一 个 文件 (MapFile) 只 包含 一 个 特定 列 的 数据 。 
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(3) 当 某 一 列 的 MapFile 数量 超过 配置 的 阔 值 时 ， 一 个 后 台 线 程 就 开始 将 现 有 的 
MapFile 合并 为 一 个 文件 ， 这 个 操作 叫 Compaction。 在 合并 的 过 程 中 ， 读 写 不 会 被 阻塞 。 

(4) 读 操作 会 先 检查 缓存 ， 若 未 命中 ， 则 从 最 新 的 MapFile 开始 ， 依 次 往 最 老 的 
MapFile 找 数据 。 可 以 想象 一 次 随机 读 操作 可 能 需要 扫描 多 个 文件 。 

HBase 的 文件 和 日 志 确 实 都 存储 在 HDFS 中 ， 但 通过 精致 设计 的 算法 实现 了 对 高 并 发 
数据 随机 读 写 的 完美 支持 ， 这 依赖 于 HBase 数据 排序 后 存储 的 特性 。 与 其 他 的 基于 Hash 
寻 址 的 NoSQL 数据 库 有 很 大 不 同 。 

在 使 用 特性 上 ， 原 生 HBase 不 支持 JDBC 驱动 ， 也 不 支持 SQL 方式 进行 数据 查询 ， 
只 有 简单 的 PUT 和 GET 操作 。 数 据 查询 通过 主键 (row key) 索 引 和 Scan 查询 方式 实现 ， 在 
事务 上 ，HBase 支持 单行 事务 (可 通过 上 层 应 用 和 模块 如 hive 或 者 coprocessor 来 实现 多 表 
join 等 复杂 操作 )。HBase 主要 用 来 存储 非 结构 化 和 半 结 构 化 的 松散 数据 ， 如 图 2.10 所 示 。 
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图 2.10 HBase 的 架构 

HBase 中 的 表 一 般 有 以 下 特点 。 

(1) 大 : 一 个 表 可 以 有 上 亿 行 ， 上 百 万 列 。 

(2) 面向 列 : 面向 列 ( 族 ) 的 存储 和 权限 控制 ， 列 ( 族 ) 独 立 检索 。 

(3) 稀 玖 :对 于 为 空 (null) 的 列 ， 并 不 占用 存储 空间 (每 个 列 族 是 一 个 文件 ， 没 内 容 的 
情况 下 不 会 占用 空间 )， 因 此 ， 表 可 以 设计 得 非常 稀 琉 。 

(4) HBase 适用 于 海量 高 并 发 文本 数据 写 入 、 存 储 、 查 询 需 求 场景 ， 这 些 数据 量 是 传 
统 数据 库 难 以 满足 的 ， 以 下 列 了 一 些 适用 场景 。 

(5) 详 单 管理 、 查 询 。 

(6) GiS 数据 存储 、 统 计 。 


(GO 有 数据 挖掘 方 法 


在 大 数据 时 代 ， 数 据 挖掘 是 最 关键 的 工作 。 大 数据 的 挖掘 是 从 海量 的 、 不 完全 的 、 有 
噪声 的 、 模 糊 的 、 随 机 的 大 型 数据 库 中 发 现 隐 含 在 其 中 的 有 价值 的 、 潜 在 有 用 的 信息 和 知 
识 的 过 程 ， 也 是 一 种 决策 支持 过 程 。 其 主要 基于 人 工 智能 、 机 器 学 习 、 模 式 学 习 、 统 计 学 
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等 。 通 过 对 大 数据 高 度 自动 化 的 分 析 ， 做 出 归纳 性 的 推理 ， 从 中 挖掘 出 潜在 的 模式 ， 可 以 
帮助 企业 、 商 家 、 用 户 调整 市 场 政 策 、 减 少 风险 、 理 性 面 对 市 场 ， 并 做 出 正确 的 决策 。 目 
前 ， 在 很 多 领域 尤其 是 在 商业 领域 (如 银行 、 电 信 、 电 商 等 )， 数 据 挖掘 可 以 解决 很 多 问 
题 ， 包 括 市 场 营销 策略 制定 、 背 景 分 析 、 企 业 管理 危机 等 。 大 数据 的 挖掘 常用 的 方法 有 分 
类 、 回 归 分 析 、 聚 类 分 析 、 关 联 规则 、 因 子 分 析 、 主 成 分 分 析 、 神 经 网 络 方法 、Web 数据 
挖掘 等 。 这 些 方法 从 不 同 的 角度 对 数据 进行 挖掘 。 


2.4.1 分 类 分 析 


分 类 是 数据 挖掘 技术 中 运用 最 为 广泛 也 是 比较 重要 的 分 析 手段 ， 它 是 指 运用 训练 数据 
集 ， 通 过 分 析 数 据 的 特征 和 运用 一 定 的 算法 求 得 分 类 规则 ， 该 分 类 规则 就 是 数据 分 类 的 模 
型 ， 然 后 运用 该 模型 对 任何 位 置 的 数据 对 象 进行 分 类 。 分 类 分 为 两 个 阶段 : 四 构建 分 类 模 
型 ， 通 过 一 定 的 算法 对 已 知 类 标记 的 数据 集 建立 分 类 模型 ，@ 用 第 一 阶段 构造 的 模型 来 预 
测 给 定 的 数据 对 象 的 类 别 。 比 较 典 型 的 分 类 方法 有 决策 树 分 类 方法 、 神 经 网 络 分 类 法 、 
贝 叶 斯 分 类 法 以 及 KK- 近邻 分 类 法 。 分 类 分 析 可 以 被 用 于 分 析 客 户 的 属性 和 特征 ， 进 行 精 
准 营 销 。 

1. 决策 树 


决策 树 是 用 于 分 类 和 预测 的 主要 技术 之 一 ， 决 策 树 学 习 是 以 实例 为 基础 的 归纳 学 习 算 
法 ， 它 着 眼 于 从 一 组 无 次 序 、 无 规则 的 实例 中 推理 出 以 决策 树 表示 的 分 类 规则 。 构 造 决策 
树 的 目的 是 找 出 属性 和 类 别 间 的 关系 ， 用 它 来 预测 将 来 未 知 类 别 的 记录 的 类 别 。 它 采用 自 
顶 向 下 的 递归 方式 ， 在 决策 树 的 内 部 节点 进行 属性 的 比较 ， 并 根据 不 同 的 属性 值 判 断 从 该 
节点 向 下 的 分 支 ， 在 决策 树 的 叶 节点 得 到 结论 。 决 策 树 的 表现 形式 类 似 于 流程 图 的 树 结 
构 ， 在 决策 树 的 内 部 节点 进行 属性 值 测试 ， 并 根据 属性 值 判断 由 该 节点 引出 的 分 支 ， 在 决 
策 树 的 叶 节 点 得 到 结论 。 内 部 节点 是 属性 或 者 属性 组 合 ， 而 叶 节点 代表 样本 所 属 的 类 或 类 
分 布 。 经 由 训练 样本 集 产生 一 棵 决策 树 后 ， 为 了 对 未 知 样本 集 进行 分 类 ， 需 要 在 决策 树 上 
测试 未 知 样本 的 属性 值 。 测 试 路 径 是 由 根 节点 到 某 个 时 节点 ， 叶 节点 代表 的 类 就 是 该 样本 
所 属 的 类 。 

2. 贝 叶 斯 分 类 

贝 叶 斯 (Bayes) 分 类 算法 是 利用 统计 学 贝 叶 斯 定理 ， 来 预测 类 成 员 的 概率 ， 即 给 定 一 个 
样本 ， 计 算 该 样本 属于 一 个 特定 的 类 的 属性 。 这 些 算法 主要 利用 Bayes 定理 来 预测 一 个 未 
知 类 别 的 样本 属于 各 个 类 别 的 可 能 性 ， 选 择 其 中 可 能 性 最 大 的 一 个 类 别 作为 该 样本 的 最 终 
类 别 。 由 于 贝 叶 斯 定理 的 成 立 本 身 需要 一 个 很 强 的 条 件 独立 性 假设 前 提 ， 而 此 假设 在 实际 
情况 中 经 常 是 不 成 立 的 ， 因 而 其 分 类 准确 性 就 会 下 降 。 为 此 就 出 现 了 许多 降低 独立 性 假设 

的 贝 叶 斯 分 类 算法 ， 如 TAN 算法 ， 它 是 在 贝 叶 斯 网 络 结构 的 基础 上 增加 属性 对 之 间 的 关 
联 来 实现 的 。 

贝 叶 斯 分 类 的 主要 算法 包括 朴素 贝 叶 斯 分 类 算法 、 贝 叶 斯 网 络 分 类 算法 等 。 

朴素 贝 叶 斯 分 类 (Naive Bayes Analysis，NBC)， 假 设 每 个 属性 之 间 都 是 相互 独立 的 ， 
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并 且 每 个 属性 对 非 类 问题 产生 的 影响 都 是 一 样 的 ， 即 一 个 属性 值 对 给 定 类 的 影响 独立 于 其 
他 属性 的 值 。 

贝 叶 斯 定理 是 概率 论 中 的 一 个 结果 ， 它 跟随 机 变量 的 条 件 概 率 以 及 边缘 概率 分 布 有 
关 。 通 常 来 讲 ， 事 件 A 在 事件 B 发 生 的 条 件 下 的 概率 ， 与 事件 B 在 事件 A 发 生 的 条 件 下 
的 概率 是 不 一 样 的 ， 这 两 者 有 确定 的 关系 ， 贝 叶 斯 定理 就 是 这 种 关系 的 陈述 。 

3. k- 近 邻 分 类 法 

k- 近 邻 分 类 法 不 是 事先 通过 数据 来 选 好 分 类 模型 ， 再 对 未 知 样本 分 类 ， 而 是 存储 带 有 
标记 的 样本 集 ， 给 一 个 没有 标记 的 样本 ， 用 样本 集中 k 个 与 之 相近 的 样本 对 其 进行 即时 分 
类 。k- 近 邻 就 是 找 出 k 个 相似 的 样本 来 建立 目标 函数 逼近 。 

k- 近 邻 的 基本 思路 : 首先 ， 存 储 一 些 标记 好 的 样本 集 ， 其 次 ， 要 有 一 个 未 知 类 的 样本 
用 来 对 其 分 类 ; 其 次 ， 逐 一 取出 样本 集中 的 样本 ， 与 未 知 类 样本 相 比较 ， 找 到 k 个 与 之 相 
近 的 样本 ， 用 这 k 个 样本 的 多 数 的 类 为 未 知 样本 定 类 ; 最 后 ， 在 样本 集 为 连续 值 时 ， 用 k 
个 样本 的 平均 值 为 未 知 样本 定 值 。 


2.4.2 回归 分 析 


回归 分 析 是 指 对 具有 相关 关系 的 两 个 变量 或 多 个 变量 建立 合适 的 数学 模型 ， 以 近似 地 
表示 变量 之 间 平 均 变化 关系 的 一 种 统计 方法 。 回 归 分 析 与 分 类 分 析 类 似 ， 但 回归 分 析 的 目 
的 不 是 寻找 描述 类 的 模式 ， 而 是 寻找 变量 间 的 关系 模式 以 确定 数值 。 例 如 简单 的 线性 回归 
技术 ， 它 的 结果 是 一 个 函数 ， 可 以 根据 输入 变量 的 值 来 计算 输出 变量 的 值 。 比 较 流行 的 回 
归 分 析 技术 有 线性 回归 和 逻辑 回归 ， 两 者 的 区 别 在 于 线性 回归 的 因 变 量 是 连续 的 ， 逻 辑 回 
归 的 变量 是 离散 的 。 此 外 ， 还 有 非 线性 回归 模型 ， 有 的 可 以 转化 为 线性 模型 。 回 归 分 析 方 
法 被 广泛 地 用 于 解释 市 场 占有 率 、 销 售 额 、 品 牌 偏好 及 市 场 营销 效果 。 

1. 线性 回归 


线性 回归 是 利用 数理 统计 中 的 回归 分 析 ， 来 确定 两 种 或 两 种 以 上 变量 间 相 互 依赖 的 定 
量 关系 的 一 种 统计 分 析 方 法 ， 运 用 十 分 广泛 。 

线性 回归 有 很 多 实际 用 途 ， 分 为 以 下 两 大 类 。 

(1) 如 果 目 标 是 预测 或 者 映射 ， 线 性 回归 可 以 用 来 对 观测 数据 集 的 值 和 XX 的 值 拟 合 出 
一 个 预测 模型 。 当 完成 这 样 一 个 模型 以 后 ， 对 于 一 个 新 增 的 蕊 值 ， 在 没有 给 定 与 它 相 配对 
的 y 值 的 情况 下 ， 可 以 用 这 个 拟 合 过 的 模型 预测 出 一 个 y 值 。 

(2) 给 定 一 个 变量 y 和 一 些 变量 钱 ,…, 为 ， 这 些 变量 有 可 能 与 y 相关 ， 线 性 回归 分 析 可 
以 用 来 量化 与 马 之 间 相 关 性 的 强度 ， 评 估 出 与 y 不 相关 的 太 ， 并 识别 出 哪些 乱 的 子 集 包 
含 关于 y 的 元 余 信息 。 

2. Logistic 回归 分 析 

Logistic 回归 模型 是 一 种 概率 模型 ， 适 合 于 病例 一 对 照 研究 、 随 访 研究 和 横断 面 研 
究 ， 且 结果 发 生 的 变量 取 值 必须 是 二 分 的 或 多 项 分 类 。 可 用 影响 结果 变量 发 生 的 因素 作为 
自 变 量 与 因 变 量 ， 建 立 回归 方程 。 
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Logistic 回归 分 析 的 主要 用 途 : 一 是 寻找 危险 因素 ， 二 是 预测 ， 三 是 判别 。 


2 二 化 号 法 
1. 聚 类 分 析 


聚 类 分 析 源 于 许多 研究 领域 ， 包 括 数据 挖掘 、 统 计 学 、 机 器 学 习 、 模 式 识别 等 。 聚 类 
分 析 是 指 将 物理 或 抽象 对 象 的 集合 分 组 成 为 由 类 似 的 对 象 组 成 的 多 个 类 的 分 析 过 程 。 聚 类 
是 将 数据 分 类 到 不 同 的 类 或 者 簇 这 样 的 一 个 过 程 ， 所 以 同一 个 簇 中 的 对 象 有 很 大 的 相似 
性 ， 而 不 同 簇 间 的 对 象 有 很 大 的 相 异 性 。 聚 类 分 析 是 一 种 探索 性 的 分 析 ， 在 分 类 的 过 程 
中 ， 人 们 不 必 事 先 给 出 一 个 分 类 的 标准 ， 聚 类 分 析 能 够 从 样本 数据 出 发 ， 自 动 进行 分 类 。 
聚 类 分 析 所 使 用 方法 的 不 同 ， 常 常会 得 到 不 同 的 结论 。 不 同 研究 者 对 于 同一 组 数据 进行 聚 
类 分 析 ， 所 得 到 的 聚 类 数 未 必 一 致 。 作 为 数据 挖掘 中 的 一 个 功能 ， 聚 类 分 析 能 作为 一 个 独 
立 的 工具 来 获得 数据 分 布 的 情况 ， 并 且 概 括 出 每 个 簇 的 特点 ， 或 者 集中 注意 力 对 特定 的 某 
些 徐 做 进一步 分 析 。 数 据 挖掘 技术 的 一 个 突出 特点 是 能 处 理 巨 大 的 、 复 杂 的 数据 集 ， 这 对 
聚 类 分 析 技 术 提 出 了 特殊 的 挑战 ， 要 求 算 法 具有 可 伸缩 性 、 可 处 理 不 同类 型 的 属性 、 可 发 
现任 意 形状 的 类 及 处 理 高 维 数据 等 。 根 据 潜在 的 各 项 应 用 ， 数 据 挖掘 对 聚 类 分 析 方 法 提出 
了 不 同 要 求 。 

聚 类 类 似 于 分 类 ， 但 与 分 类 的 目的 不 同 ， 是 针对 数据 的 相似 性 和 差异 性 将 一 组 数据 分 
为 几 个 类 别 。 属 于 同一 类 别 的 数据 间 的 相似 性 很 大 ， 但 不 同类 别 之 间 数 据 的 相似 性 很 小 ， 
跨 类 的 数据 关联 性 很 低 。 

聚 类 在 数据 挖掘 中 的 典型 应 用 有 以 下 3 个 方面 。@ 聚 类 分 析 可 以 作为 其 他 算法 的 预 处 
理 步骤 : 利用 聚 类 进行 数据 预 处 理 ， 可 以 获得 数据 的 基本 情况 ， 在 此 基础 上 进行 特征 抽取 
或 分 类 可 以 提高 精确 度 和 挖掘 效率 。 也 可 将 聚 类 结果 用 于 进一步 关联 分 析 ， 以 获得 进一步 
的 有 用 信息 。@ 可 以 作为 一 个 独立 的 工具 来 获得 数据 的 分 布 情况 : 聚 类 分 析 是 获得 数据 分 
布 情况 的 有 效 方 法 。 通 过 观察 聚 类 得 到 每 个 簇 的 特点 ， 可 以 集中 对 特定 的 某 些 簇 做 进一步 
的 分 析 。 图 聚 类 分 析 可 以 完成 孤立 点 挖掘 。 许 多 数据 挖掘 算法 试图 使 孤立 点 影响 最 小 化 ， 
或 者 排除 它们 。 然 而 孤立 点 本 身 可 能 是 非常 有 用 的 ， 如 在 金融 欺诈 探测 中 ， 孤 立 点 可 能 预 
示 着 金融 欺诈 行为 的 存在 。 

聚 类 分 析 法 有 快速 聚 类 和 系统 聚 类 。 

1) “快速 聚 类 

要 求 事先 确定 分 类 。 它 不 仅 要 求 确定 分 类 的 类 数 ， 而 且 还 需要 事先 确定 点 ， 也 就 是 聚 
类 种 子 ， 然 后 ， 根 据 其 他 点 离 这 些 种 子 的 远近 把 所 有 点 进行 分 类 。 再 然后 就 是 将 这 几 类 的 
中 心 (均值 ) 作 为 新 的 基石 ， 再 分 类 。 如 此 友 代 。 

2) “系统 聚 类 

系统 聚 类 是 将 样品 分 成 若干 类 的 方法 ， 其 基本 思想 是 : 先 将 每 个 样品 各 看 成 一 类 ， 然 
后 规定 类 与 类 之 间 的 距离 ， 选 择 距 离 最 小 的 一 对 合并 成 新 的 一 类 ， 计 算 新 类 与 其 他 类 之 间 
的 距离 ， 再 将 距离 最 近 的 两 类 合并 ， 这 样 每 次 减少 一 类 ， 直 至 所 有 的 样品 合 为 一 类 为 止 。 
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2. 关联 规则 


关联 规则 挖掘 是 数据 挖掘 中 研究 较 早 而 且 至 今 仍 活跃 的 研究 方法 之 一 。 关 联 规则 是 隐 
藏 在 数据 项 之 间 的 关联 或 相互 关系 ， 即 可 以 根据 一 个 数据 项 的 出 现 推 导出 其 他 数据 项 的 出 
现 。 关 联 规 则 的 挖掘 过 程 主要 包括 两 个 阶段 : 第 一 阶段 为 从 海量 原始 数据 中 找 出 所 有 的 高 
频 项 目 组 ; 第 二 阶段 为 从 这 些 高 频 项 目 组 产生 关联 规则 。 关 联 规则 挖掘 技术 已 经 被 广泛 应 
用 于 金融 行业 企业 中 用 以 预测 客户 的 需求 ， 通 过 捆绑 客户 可 能 感 兴趣 的 信息 供用 户 了 解 并 
获取 相应 信息 来 改善 自身 的 营销 。 

关联 规则 是 描述 数据 库 中 数据 项 之 间 所 存在 的 关系 的 规则 ， 即 根据 一 个 事务 中 某 些 项 
的 出 现 可 导出 另 一 些 项 在 同一 事务 中 也 出 现 ， 即 隐藏 在 数据 间 的 关联 或 相互 关系 。 

在 客户 关系 管理 中 ， 通 过 对 企业 的 客户 数据 库 里 的 大 量 数据 进行 挖掘 ， 可 以 从 大 量 的 
记录 中 发 现 有 趣 的 关联 关系 ， 找 出 影响 市 场 营销 效果 的 关键 因素 ， 为 产品 定位 、 定 价 与 定 
制 客户 群 ， 客 户 寻求 、 细 分 与 保持 ， 市 场 营销 与 推销 ， 营 销 风险 评估 和 诈骗 预测 等 决策 支 
持 提 供 参考 依据 。 

(1) Apriori 算法 : 使 用 候选 项 集 找 频繁 项 集 。 

Apriori 算法 是 一 种 最 有 影响 的 挖掘 布尔 关联 规则 频繁 项 集 的 算法 。 其 核心 是 基于 两 阶 
段 频 集 思 想 的 递 推算 法 。 该 关联 规则 在 分 类 上 属于 单 维 、 单 层 、 布 尔 关 联 规 则 。 在 这 里 ， 
所 有 支持 度 大 于 最 小 支持 度 的 项 集 称 为 频繁 项 集 ， 简 称 频 集 。 

该 算法 的 基本 思想 是 ， 首先 找 出 所 有 的 频 集 ， 这 些 项 集 出 现 的 频繁 性 至 少 和 预定 义 的 
最 小 支持 度 一 样 。 由 频 集 产生 强 关联 规则 ， 这 些 规则 必须 满足 最 小 支持 度 和 最 小 可 信 度 。 
然后 使 用 第 1 步 找到 的 频 集 产生 期 望 的 规则 ， 产 生 只 包含 集合 的 项 的 所 有 规则 ， 其 中 每 
一 条 规则 的 右 部 只 有 一 项 ， 这 里 采用 的 是 中 规则 的 定义 。 一 旦 这 些 规则 被 生成 ， 那 么 只 
有 那些 大 于 用 户 给 定 的 最 小 可 信 度 的 规则 才 被 留 下 来 。 为 了 生成 所 有 频 集 ， 使 用 了 递 推 的 
方法 。 

可 能 产生 大 量 的 候选 集 ， 以 及 可 能 需要 重复 扫描 数据 库 ， 是 Apriori 算法 的 两 大 
缺点 。 

(2) 基于 划分 的 算法 。 

Savasere 等 设计 了 一 个 基于 划分 的 算法 。 这 个 算法 先 把 数据 库 从 逻辑 上 分 成 几 个 互 不 
相交 的 块 ， 每 次 单独 考虑 一 个 分 块 并 对 它 生成 所 有 的 频 集 ， 然 后 把 产生 的 频 集 合并 ， 用 来 
生成 所 有 可 能 的 频 集 ， 最 后 计算 这 些 项 集 的 支持 度 。 这 里 分 块 的 大 小 选择 要 使 得 每 个 分 块 
可 以 被 放 入 主 存 ， 每 个 阶段 只 需 被 扫描 一 次 。 而 算法 的 正确 性 是 由 每 一 个 可 能 的 频 集 至 少 
在 某 一 个 分 块 中 是 频 集 保证 的 。 该 算法 是 可 以 高 度 并 行 的 ， 可 以 把 每 一 分 块 分 别 分 配给 某 
一 个 处 理 器 生成 频 集 。 产 生 频 集 的 每 一 个 循环 结束 后 ， 处 理 器 之 间 进 行 通信 来 产生 全 局 的 
候选 k- 项 集 。 通 常 这 里 的 通信 过 程 是 算法 执行 时 间 的 主要 瓶颈 ， 而 另 一 方面 ， 每 个 独立 的 
处 理 器 生成 频 集 的 时 间 也 是 一 个 瓶颈 。 

(3) FP- 树 频 集 算法 。 

针对 Apriori 算法 的 固有 缺陷 ， 械 Han 等 提出 了 不 产生 候选 挖掘 频繁 项 集 的 方法 : FP- 
树 频 集 算法 。 采 用 分 而 治之 的 策略 ， 在 经 过 第 一 遍 扫描 之 后 ， 把 数据 库 中 的 频 集 压缩 进 一 


67 


大 数据 金融 与 征 信 


ee” 


棵 频繁 模式 树 (FP-tree)， 同 时 依然 保留 其 中 的 关联 信息 ， 随 后 再 将 FP-tree 分 化 成 一 些 条 件 
库 ， 每 个 库 和 一 个 长 度 为 1 的 频 集 相关 ， 然 后 再 对 这 些 条 件 库 分 别 进 行 挖掘 。 当 原始 数据 
量 很 大 的 时 候 ， 也 可 以 结合 划分 的 方法 ， 使 得 一 个 FP-tree 可 以 放 入 主 存 中 。 


3. 因子 分 析 


因子 分 析 的 基本 目的 就 是 用 少数 几 个 因子 描述 许多 指标 或 因素 之 间 的 联系 ， 即 将 相关 
比较 密切 的 几 个 变量 归 在 同一 类 中 ， 每 一 类 变量 就 成 为 一 个 因子 ， 以 较 少 的 几 个 因子 反映 
原 资料 的 大 部 分 信息 。 

运用 这 种 研究 技术 ， 我 们 可 以 方便 地 找 出 影响 消费 者 购买 、 消 费 和 满意 度 的 主要 因素 
是 哪些 ， 以 及 这 些 因素 的 影响 力 如何 。 运 用 这 种 研究 技术 ， 我 们 还 可 以 为 市 场 细 分 做 前 期 
分 析 。 

4. 主 成 分 分 析 

设法 将 原来 的 变量 重新 组 合成 一 组 新 的 互相 无 关 的 几 个 综合 变量 ， 同 时 根据 实际 需要 
从 中 可 以 取出 几 个 较 少 的 综合 变量 尽 可 能 多 地 反映 原来 变量 的 信息 的 统计 方法 叫 作 主 成 分 
分 析 或 称 主 分 量 分 析 ， 这 也 是 数学 上 用 来 降 维 的 一 种 方法 。 

主 成 分 分 析 是 设法 将 原来 众多 的 具有 一 定 相关 性 (比如 P 个 指标 )， 重 新 组 合成 一 组 新 
的 互相 无 关 的 综合 指标 来 代替 原来 的 指标 。 

最 经 典 的 做 法 就 是 用 F1( 选 取 的 第 一 个 线性 组 合 ， 即 第 一 个 综合 指标 ) 的 方差 来 表达 ， 
即 Var(F1) 越 大 ， 表 示 Fl 包含 的 信息 越 多 。 因 此 ， 在 所 有 的 线性 组 合 中 选取 的 Fl 应 该 是 
方差 最 大 的 ， 故 称 Fl 为 第 一 主 成 分 。 如 果 第 一 主 成 分 不 足以 代表 原来 P 个 指标 的 信息 
再 考虑 选取 F2， 即 选 第 二 个 线性 组 合 ， 为 了 有 效 地 反映 原来 的 信息 ，F1 已 有 的 信息 就 不 
需要 再 出 现在 F2 中 ， 用 数学 语言 表达 就 是 要 求 Cov(F1,F2)=0， 则 称 F2 为 第 二 主 成 分 ， 以 
此 类 推 可 以 构造 出 第 三 、 第 四 …… 第 P 个 主 成 分 。 

主 成 分 分 析 作 为 基础 的 数学 分 析 方 法 ， 其 实际 应 用 十 分 广泛 ， 比 如 人 口 统计 学 、 数 量 
地 理学 、 分 子 动力 学 模拟 、 数 学 建 模 、 数 理 分 析 等 学 科 中 均 有 应 用 ， 是 一 种 常用 的 多 变量 
分 析 方 法 。 

5. 神经 网 络 方法 


神经 网 络 作 为 一 种 先进 的 人 工 智 能 技术 ， 因 其 自身 自行 处 理 、 分 布 存储 和 高 度 容 错 等 
特性 非常 适合 处 理 非 线 性 的 以 及 那些 以 模糊 、 不 完整 、 不 严密 的 知识 或 数据 为 特征 的 处 理 
问题 ， 它 的 这 一 特点 十 分 适合 解决 数据 挖掘 的 问题 。 典 型 的 神经 网 络 模型 主要 分 为 三 大 
类 : 第 一 类 是 用 于 分 类 预测 和 模式 识别 的 前 馈 式 神经 网 络 模型 ， 其 主要 代表 为 函数 型 网 
络 、 感 知 机 。 第 二 类 是 用 于 联想 记忆 和 优化 算法 的 反馈 式 神经 网 络 模型 ， 以 Hopfield 的 离 
散 模型 和 连续 模型 为 代表 。 第 三 类 是 用 于 聚 类 的 自 组 织 映射 方法 ， 以 ART 模型 为 代表 。 
虽然 神经 网 络 有 多 种 模型 及 算法 ， 但 在 特定 领域 的 数据 挖掘 中 使 用 何 种 模型 及 算法 并 没有 
统一 的 规则 ， 而 且 人 们 很 难 理解 网 络 的 学 习 及 决策 过 程 。 


6. Web 数据 挖掘 
Web 数据 挖掘 是 一 项 综合 性 技术 ， 指 Web 从 文档 结构 和 使 用 的 集合 C 中 发 现 隐 含 的 
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模式 P， 如 果 将 C 看 作 是 输入 、P 看 作 是 输出 ， 那 么 Web 挖掘 过 程 就 可 以 看 作 是 从 输入 到 
输出 的 一 个 映射 过 程 。 
当前 越 来 越 多 的 Web 数据 都 是 以 数据 流 的 形式 出 现 的 ， 因 此 对 Web 数据 流 挖掘 就 具 
有 很 重要 的 意义 。 目 前 常用 的 Web 数据 挖掘 算法 有 : PageRank 算法 ，HITS 算法 以 及 
LOGSOM 算法 。 这 3 种 算法 提 到 的 用 户 都 是 笼统 的 用 户 ， 并 没有 区 分 用 户 的 个 体 。 目 前 
Web 数据 挖掘 面临 着 一 些 问题 ， 主 要 包括 : 用 户 的 分 类 问题 ， 网 站 内 容 时 效 性 问题 ， 用 户 
在 页 面 停留 时 间 问 题 ， 页 面 的 链 入 与 链 出 数 问题 等 。 在 Web 技术 高 速 发 展 的 今天 ， 这 些 问 
题 仍 旧 值得 研究 并 加 以 解决 。 

7. 序列 分 析 

序列 分 析 是 对 序列 数据 进行 分 析 以 发 现 蕴 藏 其 中 的 模式 和 规律 。 序 列 数据 和 时 间 序 列 
数据 都 是 连续 的 观测 值 ， 观 测 值 之 间 相 互 依赖 。 它 们 之 间 的 差别 在 于 序列 数据 包含 离散 的 
状态 ， 而 时 间 序 列 是 连续 的 数值 。 序 列 数据 和 关联 数据 比较 相似 ， 它 们 都 是 一 个 项 集 或 一 
组 状态 ， 区 别 在 于 序列 分 析 分 析 的 是 状态 的 转移 ， 将 数据 间 的 关联 性 和 时 间 联 系 起 来 ， 而 
关联 分 析 不 需要 考虑 时 间 问 题 。Markov 链 是 进行 序列 分 析 的 主要 技术 之 一 。 


8. 偏差 分 析 


数据 库 中 一 般 存在 着 很 多 异常 数据 ， 找 出 这 些 异常 数据 非常 重要 ， 偏 差分 析 可 以 解决 
此 类 问题 。 偏 差分 析 用 于 检测 数据 现状 、 历 史记 录 与 标准 之 间 的 显著 变化 和 偏离 ， 例 如 ， 
观测 结果 与 期 望 的 偏离 、 分 类 中 的 反常 实例 、 模 式 的 例外 等 。 偏 差分 析 的 基本 方法 就 是 寻 
找 观察 结果 与 参照 之 间 的 差别 。 例 如 ， 信 用 卡 炊 诈 案 行为 检测 、 网 络 入 侵 检测 、 劣 质 产品 
分 析 等 。 

9. 预测 


预测 是 大 数据 最 核心 的 功能 。 大 数据 预测 是 指 运 用 历史 数据 和 预测 模型 预测 未 来 某 件 
事情 的 概率 。 精 度 和 不 确定 性 是 预测 的 关注 点 ， 通 常用 预测 方差 进行 衡量 。 预 测 技术 是 以 
表示 一 系列 时 间 值 的 数列 作为 输入 ， 接 下 来 运用 计算 机 学 习 和 统计 技术 对 数据 进行 周期 性 
分 析 、 趋 势 分 析 和 噪声 分 析 ， 进 而 估算 这 些 序列 未 来 的 值 。 例 如 ， 可 以 通过 挖掘 企业 的 历 
史 销 售 数 据 预测 该 企业 未 来 一 年 的 销售 额 。 


本 章 总 结 


e@ ”大 数据 的 处 理 流程 归纳 为 : 首先 是 利用 多 种 轻型 数据 库 收集 海量 数据 ， 对 不 同 来 
源 的 数据 进行 预 处 理 后 ， 整 合 存储 到 大 型 数据 库 中 ， 然 后 根据 企业 或 个 人 目的 和 
需求 ， 运 用 合适 的 数据 挖掘 技术 提取 有 益 的 知识 ， 最 后 利用 恰当 的 方式 将 结果 展 
现 给 终端 用 户 。 具 体 包 括 : 数据 采集 、 数 据 预 处 理 、 数 据 存储 、 数 据 挖掘 以 及 数 
据 解释 这 五 个 步骤 。 

e@ ”要 做 大 数据 ， 首 先 要 了 解 自己 的 企业 。 第 一 步 ， 找 到 核心 数据 。 第 二 步 ， 获 取 外 
围 数据 ， 通 过 营销 活动 等 获取 大 量 数据 。 第 三 步 ， 常 规 渠 道 的 数据 ， 这 就 需要 企 
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业 去 找 常规 渠道 里 面 的 数据 ， 跟 自己 的 CRM 结合 起 来 。 第 四 步 ， 获 取 外 部 的 社 
会 化 的 或 者 非 结 构 化 的 数据 ， 即 现在 所 谓 的 社会 化 媒体 数据 。 这 方面 信息 的 主要 
特征 是 非 结 构 化 ， 而 且 数 量 庞大 。 

金融 企业 的 核心 数据 主要 来 源 : 历史 交易 数据 、 用 户 行为 数据 、 系 统 运行 日 志 、 
非 结构 化 数据 、 过 程 文档 数据 。 核 心 数据 最 大 的 问题 在 于 来 源 多 样 、 流 动 性 差 、 
共享 性 差 。 要 解决 这 些 问 题 ， 必 须要 明确 数据 相关 的 职责 与 归属 、 提 升 对 数据 资 
产 质量 的 认识 和 打通 数据 流转 。 

金融 企业 外 围 数 据 主要 来 源 : 数据 共享 联盟 、 互 联网 数据 、 运 营 商 数据 。 外 围 数 
据 存在 的 问题 主要 是 : 存在 数据 获得 成 本 以 及 无 法 最 大 限度 地 发 挥 数据 的 价值 。 
分 类 是 数据 挖掘 技术 中 运用 最 为 广泛 也 是 比较 重要 的 分 析 手 段 ， 它 是 指 运用 训练 
数据 集 ， 通 过 分 析 数 据 的 特征 和 运用 一 定 的 算法 求 得 分 类 规则 ， 该 分 类 规则 就 是 
数据 分 类 的 模型 ， 然 后 运用 该 模型 对 任何 位 置 的 数据 对 象 进行 分 类 。 分 类 分 为 两 
个 阶段 : 加 构建 分 类 模型 ， 通 过 一 定 的 算法 对 已 知 类 标记 的 数据 集 建立 分 类 模 
型 ，@ 用 第 一 阶段 构造 的 模型 来 预测 给 定 的 数据 对 象 的 类 别 。 比 较 典 型 的 分 类 方 
法 有 决策 树 分 类 方法 、 神 经 网 络 分 类 法 、 贝 叶 斯 分 类 方法 以 及 天- 近邻 分 类 方法 。 


. 列举 大 数据 处 理 过 程 包括 哪 几 个 步骤 。 
. 简要 说 明 数 据 采集 的 4 个 过 程 。 

. 简要 介绍 数据 预 处 理 的 3 种 主要 方法 。 
. 简要 介绍 数据 存储 的 3 种 典型 存储 方案 。 
- 列举 数据 的 3 种 主要 来 源 。 

. 简要 说 明 核心 数据 出 现 的 最 大 问题 。 

. 陈述 外 围 数 据 的 基本 准则 。 

. 陈述 HDFS 系统 的 特性 。 


9. 简要 说 明 HDFS 的 结构 及 3 种 主要 角色 。 
10. 列举 说 明 数 据 挖 气 中 分 类 分 析 的 主要 方法 。 


大 数据 在 商业 银行 中 的 应 用 


e@ ”了解 大 数据 在 商业 银行 客户 关 @ 了 解 大 数据 风险 控制 与 传统 风 


系 管理 中 的 具体 应 用 险 控制 的 区 别 ， 以 及 大 数据 在 
@ 掌握 客户 生命 周期 管理 的 概 商业 银行 风险 管理 中 的 具体 

念 ， 了 解 大 数据 在 商业 银行 精 应 用 

准 营销 中 的 具体 应 用 @ 了 解 大 数据 是 如 何 帮 助 商 业 银 
@。 了解 大 数据 在 商业 银行 信贷 管 行进 行 运营 优化 的 

理 中 的 具体 应 用 


Q 与 其 他 行业 相 比 ， 商 业 银行 在 大 数据 技术 的 应 用 中 具有 独特 的 优势 。 这 一 优势 
多 对 主要 来 源 于 3 个 方面 : 首先 ， 商 业 银 行 的 业务 系统 信息 化 程度 高 ， 数 据 资源 充足 ; 
其 次 ， 商 业 银行 的 数据 规模 庞大 ， 数 据 种 类 较为 齐全 ; 再 次 ， 由 于 商业 银行 受到 严 
9 格 的 监管 ， 其 数据 的 格式 较为 规范 ， 数 据 的 准确 性 也 相对 较 高 。 因 此 ， 大 数据 在 商 
业 银 行 的 客户 关系 管理 、 精 准 营销 、 信 贷 管 理 、 风 险 管理 、 运 营 优化 等 方面 中 有 着 
广泛 的 应 用 。 
本 章 重 点 讲解 大 数据 在 商业 银行 客户 关系 管理 、 精 准 营销 、 信 和 贷 管 理 、 风 险 管 
理 和 运营 优化 中 的 具体 应 用 。 


Om 
(OEE 客户 关系 管理 


客户 关系 管理 这 一 概念 起 源 于 1980 年 年 初 在 美国 所 出 现 的 “接触 管理 ”， 之 后 由 
Gartner Group 公司 正式 提出 。Gartner Group 公司 将 客户 关系 管理 定义 为 公司 为 了 增加 收 
入 、 增 强 一 利 能 力 和 提高 客户 满意 度 而 提出 的 公司 战略 。 具 体 来 讲 ， 客 户 关系 管理 包括 两 
个 层面 的 含义 :一 是 公司 要 通过 一 定 方式 了 解 现 有 客户 和 潜在 客户 的 需求 ， 二 是 公司 通过 
整合 各 方面 的 信息 ， 从 而 实现 对 客户 完整 、 一 致 的 了 解 ， 且 该 过 程 贯穿 于 公司 识别 、 筛 
选 、 获 取 、 发 展 和 保持 客户 的 全 过 程 。 
当今 商业 银行 都 以 “以 客户 为 中 心 ”的 经 营 理 念 开展 业务 ， 因 而 客户 关系 管理 在 银行 
同业 竞争 中 扮演 着 重要 的 角色 。 良 好 的 客户 资源 、 高 质量 的 客户 群体 以 及 出 色 的 客户 满意 
度 和 忠诚 度 ， 可 以 帮助 公司 在 市 场 中 占据 有 利 的 竞争 地 位 。 因 此 ， 客 户 是 商业 银行 生存 和 
发 展 的 重要 资源 。 

商业 银行 通过 进行 客户 管理 ， 可 以 通过 更 高 效 、 周 到 、 便 捷 的 客户 服务 提升 其 业务 流 
程 管理 能 力 ， 从 而 降低 银行 的 运营 成 本 。 此 外 ， 基 于 数据 分 析 的 客户 管理 可 以 使 银行 最 大 
限度 地 满足 客户 个 性 化 的 需求 ， 从 而 提高 客户 对 利润 的 贡献 度 ， 实 现 客户 价值 的 最 大 化 。 

客户 关系 管理 是 基于 数据 分 析 技 术 所 进行 的 客户 管理 活动 ， 能 够 通过 数据 的 集成 、 挖 
掘 和 分 析 技 术 为 企业 的 客户 服务 、 销 售 决 策 提供 自动 化 的 解决 方案 。 因 此 ， 客 户 管理 活动 
需要 公司 不 断 提高 其 经 营 管理 水 平 ， 进 而 促进 其 管理 效率 的 不 断 提升 。 

在 大 数据 的 应 用 背景 下 ， 商 业 银行 可 以 通过 利用 大 数据 分 析 技 术 所 进行 的 客户 管理 提 
高 其 负债 业务 水 平 ， 规 避 贷 款 业 务 和 中 间 业 务 中 的 风险 。 此 外 ， 虽 然 客户 管理 概念 早已 被 
我 国 商业 银行 所 接受 ， 但 在 实际 的 实施 过 程 中 仍 存在 着 形式 大 于 实际 的 问题 。 随 着 大 数据 
技术 在 商业 银行 领域 的 应 用 ， 各 个 层次 客户 的 金融 需求 、 每 个 客户 的 个 性 化 需求 都 将 会 得 
到 极 大 的 满足 。 


3.1.1 客户 细 分 
1. 利用 大 数据 进行 客户 细 分 的 优势 


客户 细 分 又 称 为 客户 分 类 ， 是 指 将 庞大 的 客户 群体 根据 各 种 指标 划分 为 众多 细 分 的 客 
户 群 。 同 一 客户 群 中 的 客户 具有 相同 或 类 似 的 特征 ， 不 同 的 客户 群 之 间 存 在 显著 的 差异 和 
不 同 。 

商业 银行 作为 直接 向 社会 公众 提供 各 种 金融 服务 的 机 构 ， 其 客户 群体 庞大 且 覆 盖 了 所 
有 层次 的 人 群 。 因 此 在 长 期 的 金融 服务 中 ， 商 业 银行 积累 了 大 量 的 信息 数据 ， 这 些 数据 池 
盖 了 客户 的 个 人 基本 资料 、 收 入 情况 、 生 活 方式 以 及 过 往 接受 金融 服务 的 历史 记录 等 相关 
资料 。 商 业 银 行 通过 利用 先进 的 数据 库 系统 和 大 数据 挖掘 及 分 析 技术 ， 对 其 所 掌握 的 客户 
信息 进行 充分 的 利用 ， 进 而 实现 多 个 维度 的 客户 细 分 。 

1) 有 效 地 维护 和 发 展 客户 

在 利用 大 数据 技术 进行 客户 细 分 的 基础 上， 商业 银行 能 够 及 时 有 效 地 获取 不 同 层次 现 
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有 客户 和 潜在 客户 的 需求 、 业 务 机 会 、 相 关 成 本 及 风险 ， 并 及 时 准确 地 制定 相应 的 业务 策 
略 ， 从 而 向 各 个 层次 的 客户 提供 个 性 化 的 服务 和 与 其 金融 需求 相 匹配 的 业务 推荐 ， 使 其 各 
客户 群 都 得 到 良好 的 维护 和 发 展 。 
2) ”运作 效率 的 提升 
在 利用 大 数据 技术 进行 客户 细 分 的 基础 上 ， 商 业 银行 的 运作 效率 也 会 得 到 提升 。 一 方 
， 通 过 利用 大 数据 技术 进行 的 客户 细 分 是 更 为 有 效 的 ， 商 业 银 行 可 以 在 各 个 细 分 市 场 中 
发 现 新 的 业务 机 会 ， 并 及 时 采取 行动 把 握 发 展 时 机 ， 从 而 获得 更 多 春 利 。 另 一 方面 ， 在 传 
统 的 商业 银行 客户 关系 管理 中 ， 存 在 着 各 信息 系统 相互 独立 的 现象 ， 即 每 个 部 门 都 有 自己 
的 客户 关系 管理 系统 ， 各 部 门 间 的 数据 无 法 实现 共享 ， 存 在 资源 的 浪费 。 而 应 用 大 数据 技 
术 ， 可 以 在 同一 系统 中 整合 各 部 门 的 客户 信息 ， 并 向 各 部 门 提供 更 加 充分 且 多 元 化 的 信息 
资源 。 

3) “提高 综合 服务 水 平 

利用 大 数据 技术 ， 可 以 对 客户 的 相关 资料 和 信息 进行 聚 类 分 析 ， 发 现 各 个 客户 群 的 客 
户 之 间 所 存在 的 群体 性 行为 ， 从 而 将 这 些 具 有 同一 共性 特征 但 具有 不 同 需求 的 客户 组 合成 
一 个 更 大 的 新 客户 群 。 商 业 银行 可 以 利用 新 客户 群 的 共性 特征 ， 对 他 们 在 接受 金融 服务 中 
的 相似 性 进行 把 握 ， 了 解 他 们 的 投 融资 需求 ， 进 而 提供 有 针对 性 的 个 性 化 服务 ， 引 导 客 户 
的 投 融资 行为 。 在 这 一 过 程 中 ， 商 业 银 行 在 降低 服务 成 本 的 同时 能 够 获取 更 高 的 收益 ， 使 
其 综合 服务 水 平 得 以 提高 。 


2. 客户 细 分 的 类 型 


1) 根据 客户 的 风险 和 价值 进行 细 分 

这 里 所 指 客户 的 风险 主要 包括 客户 的 信用 风险 和 流失 风险 ， 而 客户 的 价值 即 客户 的 利 
润 贡 献 ， 可 以 通过 利润 率 、 营 业 收 入 等 指标 体现 。 根 据 客户 的 风险 和 价值 进行 细 分 ， 是 通 
过 对 客户 存款 、 贷 款 ， 以 及 其 在 理财 产品 、 基 金 、 保 险 等 相关 领域 的 金融 活动 进行 辨识 ， 
分 析 客 户 为 银行 带 来 利润 的 主要 业务 以 及 相应 的 利润 贡献 水 平 。 在 此 基础 上 ， 结 合 对 客户 
潜在 风险 的 分 析 和 判断 ， 将 风险 水 平和 贡献 程度 相当 的 客户 划分 为 同一 客户 群 。 从 中 我 们 
可 以 看 出 ， 商 业 银行 根据 客户 的 风险 和 价值 进行 客户 细 分 ， 是 基于 其 在 客户 关系 管理 中 的 
投入 和 产 出 进行 的 ， 有 助 于 提高 商业 银行 的 客户 管理 的 有 效 性 。 

2) ”根据 客户 交易 行为 特征 进行 细 分 

这 里 所 指 的 客户 交易 行为 ， 主 要 是 指 客户 在 进行 金融 活动 时 的 交易 金额 、 交 易 频 率 、 
交易 对 手 等 交易 信息 。 在 大 数据 技术 的 应 用 下 ， 客 户 在 进行 金融 活动 时 所 产生 的 部 分 文字 
信息 也 可 以 作为 客户 的 行为 特征 用 以 分 析 。 例 如 ， 根 据 客户 行为 进行 客户 细 分 后 ， 我 们 可 
以 找到 一 类 每 月 均匀 发 生 多 笔 汇款 业务 且 汇 出 大 额 款项 的 客户 ， 对 这 一 客户 群 有 针对 性 地 
推出 汇款 费 率 优惠 政策 ， 以 增强 现 有 客户 斐 性 ， 并 吸引 更 多 的 同类 型 客户 。 

3) ”根据 客户 的 人 口 统计 属性 和 行为 偏好 进行 细 分 

客户 的 人 口 属性 包括 其 年 龄 层次 、 收 入 水 平等 个 人 基本 信息 ; 而 客户 的 行为 偏好 主要 
是 指 客户 在 其 日 常生 活活 动 中 所 表现 出 的 兴趣 爱好 以 及 生活 方式 ， 这 一 部 分 的 信息 主要 是 
商业 银行 通过 分 析 客 户 在 使 用 其 银行 账户 进行 日 常 消费 时 的 消费 类 目 获 取 的 。 例 如 ， 根 据 
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客户 的 年 龄 层次 ， 可 以 判断 出 其 在 现 阶段 的 金融 需求 : 某 一 客户 群体 的 年 龄 层次 为 20 一 30 
岁 ， 且 最 近 发 生 了 一 笔 个 人 住房 抵押 贷款 ， 商 业 银行 可 以 及 时 地 向 该 客户 群体 提供 与 其 购 
买 力 相 匹配 的 房屋 装修 信息 ， 推 荐 住房 装修 分 期 业务 ， 从 而 为 客户 提供 恰当 的 个 性 化 服 
务 。 图 3.1 列 示 了 与 客户 相关 的 各 类 数据 。 


基本 信息 存 贷款 信息 

姓名、 年龄 、 证 件 号 国 存 取款 月 均 次 数 、 
码 、 账 户 日 均 余额 、 存 取款 月 均 额 度 、 
卡 内 余额 等 贷款 余额 、 贷 款 月 


还 款额 等 


交易 数据 消费 数据 

“ 月 均 交 易 人 月 均 消 费 金额 、 常 用 

F : 消费 方式 、 购 买 产品 
范围 、 消 费时 间 等 


图 3.1 与 客户 相关 的 各 类 数据 


3.1.2 ”预见 客户 流失 
1. 捕捉 流失 客户 的 行为 特征 


随 着 金融 市 场 竞 争 的 日 趋 激烈 ， 商 业 银 行 都 在 努力 通过 提供 适时 且 多 样 化 的 金融 服务 
吸引 更 多 的 新 客户 ， 并 与 原 有 客户 建立 良好 的 客户 关系 ， 以 降低 客户 的 流失 率 ， 从 而 使 其 
获得 长 期 利益 。 客 户 流失 的 发 生 具 有 明显 的 因果 关系 特征 ， 而 这 些 导 致 客户 流失 发 生 的 原 
因 通常 可 以 在 客户 的 账户 状态 、 历 史 交 易 信 息 、 服 务 反 馈 等 相关 数据 资料 中 体现 出 来 。 

客户 的 账户 状态 、 历 史 交 易 信息 、 服 务 反馈 等 数据 信息 通常 是 复杂 且 形 式 各 异 的 ， 因 
此 用 传统 的 数据 挖掘 技术 对 这 些 信 息 进行 分 析 是 独立 且 效 率 低下 的 。 而 大 数据 技术 在 很 大 
程度 上 弥补 了 传统 数据 挖掘 技术 的 这 一 次 端 ， 能够 以 高 效 的 处 理 分 析 能 力 对 上 述 数 据 信息 
进行 处 理 ， 帮 助 分 析 人 员 得 出 及 时 有 效 的 分 析 结 果 。 因 而 在 大 数据 技术 的 应 用 下 ， 商 业 银 
行 可 以 及 时 发 现 客户 尚未 被 满足 的 需要 和 对 现 有 服务 的 不 满 ， 及 时 采取 恰当 的 行动 解决 客 
户 的 诉求 ， 从 而 在 客户 结束 其 与 银行 的 业务 关系 之 前 ， 及 时 对 客户 进行 挽留 ， 最 大 限度 地 
减少 客户 的 流失 

2. 对 客户 流失 进行 预测 

商业 银行 应 用 大 数据 技术 可 以 对 客户 流失 进行 预测 。 在 客户 关系 维护 中 应 用 大 数据 技 
术 ， 是 从 多 角度 对 客户 状态 进行 分 析 。 因 此 ， 通 过 对 客户 流失 的 原因 进行 分 析 ， 构 建 出 客 
户 流失 的 预警 模型 ， 还 能 对 潜在 的 客户 的 流失 进行 量化 预测 。 在 找 出 客户 流失 原因 的 基础 
上 ， 根 据 客户 相关 信息 与 客户 流失 的 内 在 联系 可 以 构造 出 客户 流失 的 关键 性 指标 组 合 。 从 
而 使 商业 银行 在 日 常 运营 中 ， 通 过 利用 实时 监控 所 获得 的 相关 指标 数据 预测 客户 的 流失 概 
率 。 通 常 采用 决策 树 算法 对 流失 客户 的 特征 进行 分 析 ， 从 中 获得 流失 客户 和 潜在 流失 客户 
的 相关 数据 ， 并 及 时 地 将 流失 概率 高 的 客户 数据 及 时 分 配给 客户 服务 部 门 。 进 而 将 预测 结 
果 与 银行 的 促销 手段 相 结合 ， 实 现 客户 忠诚 度 的 有 效 提 高 。 
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3.1.3 ”高 效 渠 道 管理 

1. 整合 现 有 客户 关系 渠道 

随 着 社会 的 飞速 发 展 ， 商 业 银行 中 相互 孤立 的 客户 关系 渠道 已 不 再 适应 其 在 业务 拓 
展 、 客 户 维护 中 的 现实 需要 ， 因 而 商业 银行 需要 对 其 各 种 客户 关系 渠道 进行 整合 ， 建 立 起 
统一 的 客户 关系 管理 体系 。 在 原 有 的 商业 银行 客户 关系 管理 中 ， 各 渠道 之 间 的 信息 存在 严 
重 的 割裂 ， 各 渠道 之 间 的 数据 缺乏 有 效 的 整合 。 例 如 ， 客 户 在 柜台 上 办 理 了 个 人 住房 抵押 
贷款 业务 ， 而 要 想 在 微 信 和 银行 上 进行 查询 时 ， 通 常 很 难 获 得 想 知道 的 具体 信息 。 

应 用 大 数据 技术 可 以 通过 对 各 渠道 的 客户 信息 进行 采集 ， 对 客户 的 交易 行为 、 消 费 偏 
好 、 洪 在 需求 、 忠 诚 度 、 社 交 关 系 等 相关 数据 实现 统一 旦 有 效 的 分 析 和 整合 ， 能 够 科学 高 
效 地 对 这 些 数据 进行 及 时 的 处 理 ， 在 客户 从 任 一 渠道 接 入 银行 系统 时 ， 该 客户 的 所 有 相关 
信息 都 能 及 时 反馈 给 相应 的 渠道 。 从 中 客户 可 以 获得 良好 的 服务 体验 。 

2. 提高 渠道 管理 的 实时 性 

在 当今 的 大 数据 时 代 ， 客 户 关系 管理 的 渠道 越 来 越 强调 及 时 性 和 敏感 性 。 在 当前 客户 
关系 渠道 的 多 元 化 和 社交 媒介 化 的 趋势 下 ， 商 业 银 行 通过 利用 大 数据 技术 ， 能 够 实现 客户 
信息 的 在 线 采 集 和 交易 行为 数据 的 及 时 处 理 。 在 此 基础 上 借助 社交 网 络 技术 ， 结 合 客户 的 
历史 交易 数据 ， 通 过 对 相关 渠道 数据 的 整合 ， 商 业 银 行 可 以 实现 对 客户 关系 的 实时 精准 的 
维护 。 例 如 ， 根 据 客户 在 电子 商务 平台 中 的 消费 记录 判断 出 该 客户 的 消费 偏好 ， 通 过 实时 
采集 客户 当前 所 在 区 域内 的 优惠 信息 ， 实 时 向 客户 提供 与 其 需求 相 匹 配 的 服务 推荐 。 在 这 
一 过 程 中 ， 客 户 关 系 管理 的 效率 得 到 了 提高 。 


3.1.4 推出 增值 服务 ， 提 升 客户 忠诚 度 
1. 发现 客户 尚未 被 满足 的 服务 需求 


在 当前 的 大 数据 时 代 背 景 下 ， 增 强 客户 服务 体验 的 方式 也 越 来 越 多 样 化。 通过 应 用 大 
数据 技术 ， 能 够 有 效 地 对 客户 的 交易 行为 、 交 互 行为 及 情绪 状态 进行 整合 并 加 以 分 析 ， 从 
而 帮助 商业 银行 对 客户 的 兴趣 偏好 和 其 对 金融 服务 的 使 用 轨迹 进行 准确 的 预测 。 商 业 银 行 
根据 预测 对 产品 进行 更 加 符合 客户 需求 的 体验 化 设计 ， 对 服务 环境 和 服务 流程 进行 优化 ， 
能 够 使 其 客户 忠诚 度 得 到 有 效 的 提高 。 

2. 提供 恰当 的 增值 服务 

在 商业 银行 向 客户 提供 增值 服务 的 过 程 中 ， 通 过 整合 各 个 客户 关系 渠道 中 的 客户 意见 
和 看 法 ， 应 用 大 数据 技术 能 够 帮助 其 从 基于 这 些 客户 反馈 的 分 析 中 ， 发 现 客户 尚未 被 满足 
的 服务 需求 ， 从 而 有 意识 地 完善 和 提高 客户 在 商业 银行 各 渠道 中 的 服务 体验 。 结 合 当前 
O20O 服务 模式 ， 商 业 银 行 需要 通过 产品 创新 和 服务 优化 将 线 上 服务 和 线 下 服务 进行 有 机 整 
合 ， 结 合 客户 和 历史 交易 行为 和 当前 密切 关注 的 事件 ， 提 供 个 性 化 的 增值 服务 。 

例如 ， 商 业 银行 应 用 定位 技术 ， 根 据 客户 所 在 位 置 和 区 域 的 不 同 及 时 向 客户 推送 其 附 


75 


CR 


近 的 各 类 商家 给 予 本 行 客户 的 相关 优惠 信息 ， 从 而 在 客户 心中 树立 高 效 、 贴 心 的 服务 形 
象 。 有 的 商业 银行 还 会 基于 各 种 客户 关系 渠道 ， 向 其 客户 定期 开展 理财 知识 讲解 、 新 型 诈 
骗 的 提示 和 防范 、 时 尚 潮流 信息 发 布 等 各 类 服务 信息 。 这 些 都 是 商业 银行 基于 大 数据 技术 
向 其 客户 所 提供 的 增值 服务 。 


3.1.5 ”案例 一 一 大 数据 帮助 商业 银行 改善 与 客户 的 关系 
1. 西 太平 洋 银行 集团 


与 客户 共同 发 展 成 长 是 澳洲 四 大 行 之 一 一 一 西 太 平 洋 银行 集团 (Westpac) 一 直 遵循 的 价 
值 观 。 随 着 数据 源 的 增长 和 客户 互动 次 数 的 增加 ，Westpac 开始 了 新 的 营销 探索 ， 他 们 将 
数据 视 为 业务 的 血液 。 

在 过 去 的 两 年 多 时 间 里 ，Westpac 借助 SAS 的 分 析 工 具 打造 了 名 为 KnowMe 的 数据 驱 
动 营销 平台 ， 重 塑 与 1000 万 客户 的 关系 。2014 年 ，Westpac 每 月 会 与 客户 进行 6000 万 次 
来 自 网 点 、 呼 叫 中 心 、ATM、 移 动 端 等 渠道 的 互动 。 利 用 这 些 数据 ，Westpac 更 加 深入 地 
理解 客户 需求 ， 适 时 推荐 客户 正好 需要 的 产品 和 服务 。 营 销 方式 从 “以 产品 为 中 心 ” 向 
“以 客户 为 中 心 ” 转 变 。 这 种 转变 也 获得 了 市 场 和 客户 的 认可 ，Westpac 的 客户 满意 度 高 
居 澳 大 利 亚 银行 业 第 一 。 

2. 法 国 兴业 银行 

法 国 兴业 银行 零售 业务 部 门 决 策 与 研究 经 理 Joseph Emmanuel Trojman 确认 说 : “ 权 
力 关系 已 经 改变 了 ， 如 今 客户 已 经 习惯 于 让 银行 之 间 相互 竞争 ， 而 他 们 则 等 着 更 加 个 性 
化 、 更 加 及 时 的 服务 。” 同 时 他 还 指出 ， 最 近 一 份 Cisco 集团 的 调研 报告 显示 : 近 四 成 客 
户 表 示 如 果 他 们 现在 的 银行 不 准备 提供 个 性 化 建议 ， 他 们 将 选择 更 换 银 行 。 然 而 在 法 国 ， 
银行 普及 率 已 近 98%， 对 银行 来 说 ， 找 到 新 的 客户 是 非常 困难 的 。 因 此 ， 法 国 银 行 界 在 意 
识 到 客户 流失 风险 后 ， 尤 其 是 当 这 些 客户 的 数据 资产 会 给 他 们 带 来 更 丰厚 的 盔 利 时 ， 对 大 
数据 的 兴趣 越 来 越 浓厚 。 

在 竞争 异常 激烈 的 个 人 储蓄 市 场 ， 为 了 保持 和 增长 市 场 份 额 ， 兴 业 银 行 最 近 分 析 了 他 
们 在 法 国 800 万 个 人 客户 的 收入 、 储 蓄 等 数据 ， 并 着 重 研究 了 公司 分 红 、 奖 金 和 第 13 个 
月 工资 的 发 放 日 期 。 目 的 是 为 每 一 位 客户 确定 推荐 储蓄 产品 的 最 佳 时 机 。Joseph Emmanuel 
Trojman 感叹 说 : “给 800 万 客户 做 分 析 ， 工 作 量 让 人 叹为观止 。 如 果 没 有 大 数据 的 计算 
能 力 ， 电 脑 一 定 急 得 跳 脚 了 。” 其 他 的 不 说 ， 只 在 处 理 时 间 上 ， 大 数据 技术 可 以 让 之 前 需 
要 三 四 天 的 数据 分 析 缩短 为 三 四 分 钟 。 


(CO 精准 营销 
商业 银行 的 精准 营销 是 指 在 商业 银行 对 其 客户 进行 精准 定位 的 基础 上 ， 结 合 不 同 客户 


的 金融 需求 ， 依 托 信息 技术 手段 ， 以 向 客户 提供 适宜 的 个 性 化 服务 推荐 和 产品 营销 。 在 精 
准 营 销 的 过 程 中 ， 需 要 对 客户 的 收入 状况 、 业 务 类 型 、 行 为 偏好 、 聚 集 区 域 、 活 动 轨迹 等 
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信息 进行 处 理 ， 从 而 使 商业 银行 对 其 客户 的 认 知 程度 、 消 费 行为 和 金融 需求 形成 科学 的 分 
析 和 预测 ( 见 图 3.2)。 


本 SE 营销 活动 执 
客户 的 精准 传播 途径 的 Poem 


图 3.2 精准 营销 流程 

上 述 通过 客户 行为 分 析 并 对 客户 需求 进行 预测 以 实现 精准 营销 的 过 程 离 不 开 大 数据 技 
术 的 应 用 。 例 如 ， 西 班 牙 对 外 银行 就 推出 了 ATM 机 ABIL， 不 仅 在 安全 性 和 便利 性 上 要 优 
于 传统 的 ATM， 而 且 还 具备 领先 的 记忆 了 功能。 客户 在 AIM 上 的 历史 取款 金额 和 取款 频率 
数据 均 被 存储 ， 在 客户 取款 时 ABIL 会 根据 其 存储 的 该 客户 账户 情况 给 予 客户 取款 建议 。 

传统 的 商业 银行 营销 策略 通常 是 基于 对 未 来 一 段 时 间 内 的 经 济 环境 、 监 管 政策 、 自 身 
规模 、 客 户 资源 、 同 业 竞 争 等 方面 的 考虑 制定 出 来 的 ， 强 调 规模 优势 和 实体 经 营 优势 而 忽 
视 客户 的 个 性 化 需求 。 而 在 大 数据 时 代 ， 通 过 对 多 种 渠道 所 获得 的 信息 进行 整合 、 分 析 和 
应 用 ， 进 而 满足 客户 的 个 性 化 需求 才 是 商业 银行 成 功 营销 的 关键 。 


3.2.1 客户 生命 周期 管理 
1. 什么 是 客户 生命 周期 管理 


客户 生命 周期 是 指 从 企业 尝试 接触 客户 或 客户 开始 了 解 企业 时 开始 ， 到 客户 终止 其 所 
接受 企业 提供 服务 时 结束 的 这 一 段 时 间 。 客 户 生命 周 期 是 产品 生命 周期 的 演变 ， 对 客户 生 
命 周期 进行 管理 ， 有 助 于 商业 银行 针对 不 同 阶段 客户 群 的 需求 特征 ， 适 时 地 采取 有 针对 性 
的 营销 策略 ， 从 而 实现 精准 营销 以 延长 客户 的 生命 周期 。 

客户 生命 周期 可 以 分 为 客户 获取 、 客 户 提升 、 客 户 成 熟 、 客 户 衰退 、 客 户 流失 5 个 阶 
段 。 在 生命 周期 的 不 同 阶段 所 要 考虑 的 问题 不 同 ， 应 当 采 取 的 应 对 策略 也 不 同 ， 如 图 3.3 


所 示 。 


gr “ 如 何 获取 “如 何 增加 “如何 培 养 “如何 延长 “如何 挽回 
客户 客户 价值 客户 忠诚 客户 的 生 客户 
度 ?如 何 使 
客户 接受 
新 产品 


. 应 采取 的 ”发 现 潜在 .提供 刺激 交叉 营销 、 .对 潜在 流 。“… 挽回 已 流 
应 对 策略 AN 客户 、 通 。 客户 需求 ”个 性 化 推荐 失 客户 的 失 的 高 价 
E>》 Nh 值 客 


图 3.3 客户 生命 周期 各 阶段 
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2. 大 数据 技术 在 客户 生命 周期 管理 中 的 应 用 


商业 银行 应 用 客户 生命 周期 管理 的 流程 包括 如 下 4 个 步骤 。 

(1) 从 客户 和 市 场 的 数据 资料 中 挖掘 客户 尚未 被 满足 的 金融 需求 和 市 场 发 展 趋势 。 

(2) 分 析 客 户 的 交易 行为 、 消 费 行为 和 兴趣 偏好 ， 以 及 客户 为 商业 银行 创造 利润 的 价 
值 驱动 因素 。 
(3) 基于 相关 市 场 条 件 的 假定 ， 提 出 恰当 的 营销 举措 和 政策 ， 推 出 具有 吸引 力 的 产品 
和 服务 ， 以 实现 客户 价值 的 最 大 化 。 

(4) 对 新 营销 举措 和 政策 、 新 产品 和 服务 的 市 场 反 应 进行 追踪 ， 及 时 改进 相关 营销 策 
略 和 产品 服务 ， 在 获得 良性 的 市 场 反应 后 进一步 推广 。 

在 上 述 商 业 银行 客户 关系 管理 的 流程 中 ， 大 数据 技术 主要 在 步骤 (10) 和 步骤 (2) 中 发 挥 作 
用 。 包 在 客户 获取 阶段 ， 通 过 利用 大 数据 技术 对 新 进 客户 的 主要 特征 及 关键 购买 因素 进行 
分 析 ， 从 而 发 现 潜在 客户 群 并 选择 有 效 的 营销 渠道 来 获取 潜在 客户 。 四 在 客户 提升 阶段 ， 
通过 利用 大 数据 技术 分 析 现 有 客户 的 业务 使 用 情况 和 主要 行为 特征 ， 了 解 真实 的 客户 反 
馈 ， 进 而 发 现 基于 客户 需求 的 潜在 市 场 空间 以 及 客户 价值 提升 的 障碍 ， 适 时 地 推出 满足 客 
户 潜在 需求 的 新 产品 以 及 适应 各 类 客户 群 的 个 性 化 服务 。@ 在 客户 成 熟 阶段 ， 通 过 利用 大 
数据 技术 分 析 和 跟踪 成 熟 客 户 的 深度 需求 和 忠诚 程度 ， 进 而 对 客户 进行 交叉 营销 和 个 性 化 
推荐 ， 以 提高 客户 的 黏 性 。@ 在 客户 衰退 阶段 ， 通 过 利用 大 数据 技术 分 析 和 监控 客户 账户 
状态 的 变化 ， 发 现 客户 流失 的 主要 驱动 因素 并 对 客户 流失 进行 预测 ， 在 充分 了 解 市 场 竞 争 
态势 的 基础 上 ， 通 过 采取 有 针对 性 的 营销 举措 最 大 限度 地 降低 客户 流失 的 可 能 性 。@@ 在 客 
户 流失 阶段 ， 通 过 利用 大 数据 技术 对 流失 客户 的 相关 数据 进行 分 析 ， 找 出 客户 流失 的 主要 
原因 ， 进 而 采取 有 针对 性 的 营销 策略 来 挽回 已 流失 客户 。 


3.2.2 ”实时 营销 


实时 营销 是 指 根据 特定 客户 当前 的 个 性 化 需要 ， 向 其 提供 商品 或 服务 ， 并 在 客户 使 用 
该 商品 或 服务 时 自动 收集 客户 的 使 用 信息 ， 并 对 这 些 信 息 进行 分 析 以 了 解 客 户 的 行为 偏好 
和 具体 需求 ， 进 而 自动 对 其 产品 或 服务 进行 调整 ， 实 现 对 客户 需求 适应 的 实时 性 。 实 时 营 
销 是 在 传统 营销 的 基础 上 发 展 而 来 的 。 虽 然 实时 营销 与 传统 营销 都 是 以 客户 需求 为 出 发 点 
和 主要 着 眼 点 ， 但 传统 营销 所 强调 的 仅仅 是 客户 当前 的 需求 ， 而 实时 营销 与 之 相 比 更 加 强 
调 客户 的 动态 性 需求 ， 包 括 客户 当前 的 需求 和 未 来 的 需求 。 

1. 实时 营销 的 特征 

1) “满足 客户 当前 的 个 性 化 需求 

即 在 营销 过 程 中 ， 向 客户 提供 的 产品 或 服务 要 适应 客户 多 种 多 样 的 个 性 化 需求 。 为 实 
现 这 一 目标 ， 商 业 银行 在 向 客户 进行 营销 前 需要 利用 大 数据 技术 采集 和 分 析 客 户 在 使 用 产 
品 或 服务 前 所 存在 的 现 有 需求 ， 从 而 实现 有 效 的 营销 。 

2) ”在 动态 过 程 中 满足 客户 未 来 的 需求 

即 在 客户 使 用 产品 或 服务 的 过 程 中 ， 及 时 地 获取 客户 每 一 时 点 的 需求 ， 从 而 通过 完善 
其 向 客户 提供 的 产品 或 服务 ， 实 现 对 客户 动态 需求 的 满足 。 商 业 银 行 通过 利用 大 数据 技 
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术 ， 及 时 获取 和 分 析 客户 在 使 用 产品 或 服务 中 的 需求 的 变化 ， 从 而 及 时 地 对 其 产品 或 服务 
的 性 能 进行 完善 和 修补 ， 从 而 实现 在 动态 过 程 中 的 有 效 营销 。 

3) “客户 一 一 产品 ” 层 的 信息 反馈 模式 

在 传统 营销 中 ， 客 户 信息 的 反馈 处 于 “客户 一 一 公司 ” 层 ， 即 客户 需求 的 反馈 信息 是 
先 传递 给 公司 ， 公 司 基 于 反馈 再 对 产品 或 服务 进行 改进 和 完善 ， 从 而 再 对 客户 的 动态 需求 
进行 满足 ， 公 司 是 中 心 组 织 。 而 在 动态 营销 中 ， 客 户 的 反馈 信息 处 于 “客户 一 一 产品 ” 
层 ， 即 产品 与 客户 之 间 形 成 独立 的 关系 系统 ， 客 户 的 动态 需求 能 够 及 时 地 被 产品 接受 并 加 
以 满足 。 商 业 银 行 的 运营 效率 无 疑 会 得 到 提升 。 

4) ”适应 的 过 程 在 无 意识 的 状态 下 完成 

在 实时 营销 的 过 程 中 ， 客 户 是 无 意识 地 做 出 反馈 的 : 客户 无 须 专门 提出 意见 、 建 议 或 
完善 资料 信息 ; 公司 是 无 意识 地 做 出 产品 或 服务 调整 的 ; 基于 大 数据 技术 的 信息 捕获 和 分 
析 ， 产 品 或 服务 能 够 及 时 地 对 所 发 现 的 不 足 和 空间 进行 调整 和 满足 ， 无 须 公 司 层 做 出 
反应 。 

2. 大 数据 技术 与 实时 营销 过 程 

1) 感知 阶段 

在 实时 营销 过 程 中 ， 商 业 银 行 利用 大 数据 技术 ， 能 够 实时 地 对 与 客户 产品 使 用 和 服务 
体验 相关 的 电子 记录 进行 获取 和 挖掘 ， 从 中 获取 客户 体验 的 实时 信息 ， 从 而 有 效 地 感知 客 
户 对 其 所 提供 的 产品 或 服务 的 现实 需求 。 

2) 分析 阶段 

基于 感知 阶段 所 获取 的 信息 ， 大 数据 技术 能 够 对 这 些 信 息 进 行 自动 的 分 析 ， 从 而 帮助 
商业 银行 了 解 其 所 提供 的 产品 或 服务 中 所 存在 的 主要 不 足以 及 发 展 空间 。 在 运用 大 数据 技 
术 的 基础 上 ， 商 业 银 行 对 客户 需求 的 获取 在 提高 准确 性 的 同时 成 本 也 会 大 幅 降低 ， 使 商业 
银行 对 市 场 的 把 握 能 力 得 以 增强 。 

3) ”适应 阶段 

基于 在 前 述 两 个 阶段 运用 大 数据 技术 ， 商 业 银 行 对 市 场 的 感知 能 力 和 分 析 能 力 已 大 幅 
提高 ， 此 时 产品 或 服务 的 适应 能 力 就 成 为 实时 营销 的 关键 。 因 此 ， 商 业 银 行 在 对 其 产品 或 
服务 进行 设计 时 ， 应 当 在 其 中 使 用 一 定 成 熟 的 智能 技术 ， 从 而 帮助 其 产品 或 服务 对 客户 需 
求 的 动态 变化 做 出 及 时 有 效 的 调整 。 


3.2.3 ”交叉 营销 

交叉 营销 就 是 基于 所 发 现 的 客户 的 多 种 需求 ， 通 过 销售 多 种 相关 的 产品 或 服务 来 满足 
客户 需求 的 营销 方式 。 换 言 之 ， 交 叉 营 销 是 一 种 从 横向 角度 开发 市 场 的 营销 方式 ， 在 这 一 
过 程 中 客户 的 多 种 需求 能 够 同时 被 发 现 和 满足 。 

1. 银行 业 中 的 交叉 营销 

交叉 营销 在 银行 业 的 作用 尤为 明显 。 因 为 客户 在 购买 银行 所 提供 的 金融 产品 和 服务 时 
需要 提交 一 定 的 个 人 资料 ， 其 购买 行为 也 会 被 记录 下 来 形成 电子 资料 ， 这 些 数据 资料 可 以 
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帮助 商业 银行 分 析 和 了 解 客户 需求 ， 从 而 为 其 客户 提供 更 多 更 优质 的 金融 产品 和 服务 。 此 
外 ， 这 些 数据 还 可 以 在 保护 客户 隐私 的 基础 上 ， 与 商业 银行 的 互补 金融 企业 之 间 共 享 ， 进 
而 实现 互助 营销 。 

商业 银行 在 当下 所 面临 的 主要 挑战 不 再 是 市 场 份额 的 竞争 ， 而 是 利润 份额 的 竞争 ， 因 
而 商业 银行 的 着 眼 点 不 再 是 一 味 地 扩大 规模 ， 而 是 努力 提高 每 个 客户 的 贡献 程度 。 采 用 交 
又 营销 的 策略 ， 能 够 帮助 商业 银行 以 最 低 的 成 本 使 客户 尽 可 能 同时 拥有 多 种 银行 所 提供 的 
金融 产品 或 服务 ， 进 而 使 银行 的 利润 得 以 增加 ， 使 其 客户 忠诚 度 也 得 以 提高 。 

2. 大 数据 技术 在 交叉 营销 中 的 作用 

交叉 营销 成 功 的 关键 在 于 : 找 对 人 、 说 对 话 和 做 对 事 。 基 于 现 有 的 客户 数据 资料 ， 商 
业 银行 借助 大 数据 技术 可 以 对 其 所 掌握 的 客户 资料 进行 整合 和 关联 性 分 析 ， 进 而 高 效 地 发 
气 出 客户 潜在 的 多 样 且 相互 关联 的 需求 ， 进 而 有 针对 性 地 进行 交叉 销售 。 

1) 找 对 人 

找 对 人 是 指 要 找 准 具体 的 客户 群体 。 商 业 银 行 利用 大 数据 技术 可 以 对 客户 使 用 金融 产 
品 和 服务 时 的 行为 特征 进行 分 析 ， 并 根据 这 些 特征 将 客户 分 成 组 内 特征 相似 、 组 间 特 征 不 
同 的 群 组 ， 进 而 发 现 针对 不 同 的 客户 群 的 市 场 机 会 。 

2) ”说 对 话 

说 对 话 是 指 通过 对 客户 数据 进行 分 析 ， 选 择 有 效 的 促销 渠道 。 商 业 银行 通过 大 数据 技 
术 还 可 以 了 解 到 不 同 客户 群 的 心理 特征 和 行为 偏好 ， 进 而 使 商业 银行 在 找 对 人 的 基础 上 ， 
能 够 根据 不 同 客户 群 的 偏好 对 其 不 同 的 目标 客户 进行 有 针对 性 的 宣传 和 营销 活动 。 

3) ”做 对 事 

做 对 事 是 指向 目标 客户 推荐 与 其 需求 相符 的 产品 或 服务 。 商 业 银行 利用 大 数据 技术 能 
够 发 现 产品 与 产品 之 间 、 服 务 与 服务 之 间 、 产 品 与 服务 之 间 的 关联 规则 ， 找 出 最 优 的 产品 
或 服务 组 合 ， 进 而 提高 商业 银行 在 找寻 组 合 销售 机 会 时 的 准确 性 。 


3.2.4 社交 化 营销 


社交 是 指 人 们 之 间 传 递 信息 、 交 流 思 想 的 交际 往来 活动 。 社 交 化 营销 即 企业 有 意识 地 
利用 社交 活动 进行 营销 。 随 着 移动 互联 网 的 不 断 发 展 ， 越 来 越 多 的 商业 银行 开始 重视 运用 
网 络 手段 创造 价值 、 提 高 品牌 影响 力 ， 以 期 在 当前 激烈 的 市 场 竞 争 中 出 奇 制胜 。 

1. 商业 银行 进行 社交 化 营销 的 动因 

1) ”客户 消费 行为 的 演变 

移动 互联 网 的 出 现 和 社交 媒体 的 普及 代表 着 人 们 在 新 时 代行 为 方式 的 转化 。 过 去 人 们 
使 用 电脑 浏览 网 页 、 在 线 支 付 、 汇 款 转账 ， 但 现在 越 来 越 多 的 资金 划 转 和 收 付 是 在 移动 终 
端 设 备 上 完成 的 。 因 此 ， 为 了 避免 出 现 商业 银行 与 客户 之 间 的 隔绝 ， 商 业 银 行 需要 顺应 时 
代 潮 流 ， 采 取 新 的 营销 方式 接近 客户 。 

2) “增进 与 客户 之 间 的 联系 与 互动 

现在 人 与 人 之 间 的 联系 和 沟通 越 来 越 多 地 依赖 社交 媒体 。 商 业 银行 主动 与 社交 媒体 相 
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合 ， 无 疑 可 以 增进 其 与 客户 之 间 的 联系 ， 增 强 客户 的 服务 体验 。 商 业 银 行 可 以 利用 社交 
媒体 与 客户 进行 互动 ， 收 集 客户 对 于 其 产品 的 问题 、 评 价 、 反 馈 和 建议 ， 进 而 拉 近 与 客户 
之 间 的 关系 、 对 其 所 提供 的 产品 和 服务 进行 完善 和 改进 。 

3) “信息 传递 速度 快 、 范 围 广 、 针 对 性 强 

社交 媒体 作为 人 与 人 之 间 沟 通 的 媒介 ， 有 具有 直接 、 快 速 和 便捷 的 特点 。 因 此 ， 商 业 银 
行 借助 社交 媒体 进行 社交 化 营销 ， 可 以 将 产品 和 服务 信息 直接 传递 到 客户 手中 。 而 且 由 于 
社交 媒体 的 用 户 数量 庞大 ， 通 过 社交 媒体 进行 营销 有 着 广大 的 受众 范围 。 此 外 ， 借 助 大 数 
据 技术 和 定位 技术 ， 商 业 银 行 可 以 向 客户 提供 与 其 需求 特征 相符 的 针对 性 营销 。 

4) ”获取 客户 信息 的 能 力 增强 

商业 银行 借助 社交 媒体 可 以 与 客户 进行 直接 的 沟通 ， 也 可 以 通过 收集 客户 基于 社交 媒 
体 与 银行 所 发 生 互动 的 相关 数据 并 加 以 整合 和 分 析 ， 对 客户 需求 、 现 有 产品 和 服务 的 市 场 
反应 和 不 足 形成 清晰 的 了 解 ， 从 而 使 商业 银行 的 营销 更 加 高 效 。 


2. 大 数据 技术 在 社交 化 营销 中 的 运用 


1) ”获取 信息 

在 社交 化 营销 中 ， 商 业 银 行 利用 大 数据 技术 可 以 基于 其 在 社交 媒体 的 后 台 直 接 获 取 多 
种 多 样 的 数据 信息 ， 这 些 数据 信息 是 后 续 客户 需求 分 析 、 产 品 与 市 场 间 关系 把 握 和 具体 营 
销 策略 制定 的 基础 。 

2) ”分 析 需 求 

在 信息 获取 的 基础 上 ， 商 业 银 行 利用 大 数据 技术 对 其 从 社交 媒体 平台 上 所 获取 的 信息 
进行 分 析 和 挖掘 ， 进 而 使 其 对 客户 的 多 样 化 需求 、 现 有 产品 和 服务 的 不 足以 及 市 场 空间 形 
成 清晰 的 认 知 。 

3) ”高效 营销 

在 前 述 工作 的 基础 上 ， 商 业 银 行将 分 析 结 果 与 市 场 趋势 相 结 合 ， 能 够 制定 出 与 不 同 客 
户 需 求 相 适应 的 针对 性 营销 策略 ， 从 而 使 其 营销 效率 得 到 大 幅 提高 。 


3.2.5 个 性 化 推荐 


个 性 化 推荐 是 指 根据 客户 的 交易 特征 和 行为 偏好 ， 向 客户 推荐 其 可 能 感 兴趣 的 产品 、 
服务 和 信息 ， 从 而 实现 交叉 销售 的 营销 行为 。 个 性 化 推荐 的 实现 离 不 开 大 数据 技术 的 
运用 。 

随 着 社会 的 不 断 进步 和 发 展 ， 商 业 银 行 所 提供 的 金融 产品 和 服务 越 来 越 多 ， 客 户 在 基 
于 自身 的 金融 需求 对 其 进行 筛选 时 ， 难 免 要 花费 大 量 的 时 间 和 精力 。 而 在 这 存在 信息 过 载 
问题 的 过 程 中 ， 很 可 能 会 导致 客户 的 流失 。 为 解决 这 一 问题 ， 商 业 银行 可 以 运用 大 数据 技 
术 建 立 面向 其 客户 的 个 性 化 推荐 系统 。 

在 个 性 化 推荐 系统 中 ， 大 数据 技术 被 用 于 对 商业 银行 从 各 个 渠道 (例如 ， 跟 踪 客户 的 浏 
览 购买 信息 ) 所 获取 的 海量 客户 数据 进行 充分 的 整合 挖掘 ， 从 而 帮助 商业 银行 为 其 客户 提供 
个 性 化 的 金融 决策 支持 和 信息 服务 。 在 这 一 过 程 中 ， 商 业 银 行 不 再 是 根据 客户 的 关注 和 浏 
览 数据 就 进行 产品 或 服务 的 推荐 和 营销 ， 而 是 在 对 客户 数据 进行 纵向 分 析 的 基础 上 ， 对 客 
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户 的 行为 偏好 进行 充分 的 分 析 和 挖掘 ， 从 而 找 出 客户 的 共性 行为 并 加 以 推荐 。 商 业 银 行 通 
过 利用 大 数据 技术 分 析 一 段 时 间 内 客户 行为 与 产品 和 服务 的 关联 性 、 金 融 产品 和 服务 的 购 
买 频率 和 偏好 ， 能 够 根据 模型 的 自动 学 习 演 变 功能 预测 出 客户 未 来 的 购买 需求 和 购买 时 
间 ， 从 而 及 时 地 向 客户 做 出 适当 的 推荐 。 


(OERD 信 贷 管 理 


信贷 管理 是 指 商 业 银 行 在 国家 现行 的 法 律 规 定 和 相关 政策 的 约束 和 规范 下 ， 根 据 安全 
性 、 流 动 性 和 收益 性 的 原则 对 其 所 发 放 的 贷款 进行 贷 前 调查 、 贷 时 审查 和 贷 后 管理 的 过 
程 。 商 业 银 行 信 贷 管理 的 目标 是 降低 其 信贷 业务 的 风险 ， 以 实现 信贷 业务 的 效益 最 大 化 。 


3.3.1 ”贷款 风险 评估 


贷款 是 商业 银行 最 为 主要 的 资产 ， 也 是 影响 其 经 营 能 力 的 关键 因素 。 因 此 ， 商 业 银 行 
要 最 大 限度 地 降低 和 控制 贷款 风险 ， 对 贷款 风险 进行 评估 是 必要 的 。 


1. 传统 贷款 风险 评估 所 面临 的 挑战 


具有 快捷 、 简 化 和 纯 信 用 特点 的 互联 网 金融 正在 快速 发 展 ， 给 传统 的 信用 风险 评估 带 
来 了 不 小 的 挑战 。 其 中 ， 快 捷 性 主要 体现 在 贷款 申请 和 审批 的 快速 和 便捷 方面 ， 要 求 贷款 
审批 过 程 要 实现 自动 化 和 系统 化 、 减 少 人 工 审批 所 占 比 重 。 简 化 性 和 纯 信 用 性 则 主要 体现 
在 客户 申请 贷款 时 所 需 提交 材料 数量 的 减少 和 申请 过 程 的 便利 方面 ， 但 简化 性 可 能 会 导致 
更 加 严重 的 信息 不 对 称 ， 纯 信用 则 对 商业 银行 客户 风险 评估 的 准确 性 提出 了 更 高 的 要 求 。 

从 中 我 们 可 以 看 到 ， 商 业 银 行 在 创新 模式 下 进行 贷款 风险 评估 需要 从 多 个 维度 获取 客 
户 信息 ， 并 利用 有 效 的 风险 计量 技术 对 其 所 面临 的 贷款 风险 进行 合理 评估 。 


2. 大 数据 应 用 下 的 贷款 风险 评估 


1) “信息 输入 的 多 样 性 

传统 的 贷款 风险 计量 主要 是 利用 贷款 申请 人 的 申请 信息 、 中 国人 民 银 行 的 征 信 信 息 建 
立信 用 评分 模型 和 风险 规则 的 。 利 用 大 数据 技术 对 风险 进行 计量 突破 了 传统 计量 方法 的 限 
制 ， 不 再 仅 依 靠 传统 数据 对 风险 进行 计量 ， 而 是 将 更 多 的 非 传 统 数据 纳入 风险 评估 系统 ， 
从 而 可 以 更 全 面 地 对 贷款 人 的 信用 状况 和 风险 程度 进行 评估 。 从 中 可 以 看 出 ， 商 业 银行 运 
用 大 数据 技术 对 贷款 风险 进行 分 析 评估 ， 能 够 帮助 其 在 保证 评估 结果 准确 性 的 基础 上 ， 优 
化 贷款 审批 流程 ， 提 高 贷款 申请 和 审批 的 速度 和 便利 程度 ， 进 而 使 商业 银行 的 经 营 效率 和 
同业 竞争 力 得 以 提高 。 

2) ”评估 过 程 的 自动 化 

在 大 数据 背景 下 的 贷款 风险 评估 过 程 中 ， 实 现 了 授信 审批 的 流水 线 作业 ， 并 呈现 出 自 
动 化 的 特点 。 如 图 3.4 所 示 ， 贷 款 风险 评估 通常 包括 获取 申请 信息 、 外 部 信息 采集 、 决 策 
规则 校 验 、 电 话 核实 、 评 分 卡 运行 、 得 出 审批 结果 这 6 个 环节 。 这 6 个 环节 的 先后 顺序 是 
可 以 根据 实际 情况 进行 有 机 调节 的 ， 也 可 以 根据 实际 情况 的 需要 改变 其 串 并 联 方 式 。 
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图 3.4 ”贷款 风险 评估 流程 
例如 ， 对 于 资信 情况 较 差 的 客户 群 ， 由 于 进行 外 部 信息 查询 时 商业 银行 需要 支付 相应 
的 查询 成 本 ， 而 该 类 客户 的 审批 通过 率 较 低 ， 对 其 进行 外 部 信息 查询 无 疑 会 增加 运营 成 
本 、 降 低 资 信 评 估 系 统 的 运行 效率 。 因 此 ， 可 以 针对 该 类 客户 调整 贷款 风险 评估 过 程 ， 如 
图 3.5 所 示 。 


不 符合 基本 要 求 


3.5 ”贷款 风险 评估 流程 一 变形 一 


此 外 ， 为 提升 贷款 风险 评估 过 程 的 处 理 效率 ， 可 以 将 外 部 信息 采集 、 决 策 规则 校 验 和 
电话 核实 3 个 环节 同时 进行 ， 在 得 到 3 个 环节 的 结果 后 直接 进入 评分 卡 运行 环节 ， 如 


2 
四 


图 3.6 贷款 风险 评估 流程 一 变形 二 
3. 客户 风险 评估 模型 


贷款 申请 风险 模型 是 商业 银行 在 信贷 管理 中 最 为 常用 也 是 最 为 重要 的 模型 。 该 模型 是 
在 对 客户 多 方面 的 信息 数据 进行 分 析 挖掘 的 基础 上 ， 形 成 对 客户 资信 状况 的 综合 评价 ， 从 
而 判断 向 该 客户 提供 信贷 服务 的 风险 。 该 模型 除了 可 以 帮助 商业 银行 准确 地 识别 和 引入 优 
质 客 户外 ， 还 能 帮助 商业 银行 制定 差异 化 的 客户 管理 策略 。 

在 该 模型 中 ， 客 户 风险 是 被 衡量 对 象 ， 目标 变量 由 客户 的 逾期 情况 决定 ， 在 考核 期 内 
和 逾期 天 数 超过 给 定 阔 值 即 为 劣质 客户 ， 未 发 生 逾 期 或 逾期 天 数 未 超过 规定 天 数 的 为 优质 客 
户 。 预 测 变量 则 根据 客户 所 提交 的 申请 信息 、 客 户 过 去 的 历史 交易 信息 和 客户 在 第 三 方 的 
行为 信息 确定 ， 包 括 但 不 限于 以 下 几 个 方面 : 工作 单位 、 家 庭 状况 、 资 产 负债 情况 、 学 历 
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层次 、 历 史 信贷 行为 、 基 本 账户 流水 、 公 积 金 状况 、 社 保 状 况 、 社 交 状 况 、 网 络 交易 行 
为 、 浏 览 行为 等 。 

贷款 风险 评估 模型 主要 应 用 于 贷款 申请 阶段 ， 服 务 于 客户 准 入 。 对 于 经 模型 判定 得 分 
较 低 的 客户 ， 商 业 银行 通常 直接 拒绝 其 贷款 申请 ;对 于 那些 评分 在 事先 所 设 定 好 的 准 入 评 
分 闷 值 附近 的 客户 ， 商 业 银 行 可 以 通过 进行 二 次 评估 来 决定 是 否 向 该 客户 授信 ;而 对 于 评 
分 较 高 的 客户 ， 商 业 银 行 可 以 直接 做 出 授信 决策 。 

在 该 模型 中 ， 传 统 的 信息 数据 多 为 静态 信息 ， 对 客户 风险 评估 所 起 到 的 作用 十 分 有 
限 。 而 基于 大 数据 技术 所 引入 的 多 渠道 行为 数据 多 为 动态 信息 ， 弥 补 了 静态 数据 的 不 足 。 
因而 在 贷款 风险 评估 中 将 大 数据 与 传统 数据 相 结合 ， 能 够 有 效 地 提高 模型 的 评估 能 


3.3.2 信用卡 自动 授信 


商业 银行 传统 信用 卡 授信 方式 是 人 工 审核 申请 资料 ， 然 后 根据 客户 大 致 的 风险 等 级 发 
放 相应 的 授信 额度 或 拒绝 申请 。 在 信用 卡 用 户 使 用 信用 卡 的 过 程 中 ， 商 业 银行 积累 了 大 量 
的 信用 卡 客户 数据 ， 可 以 把 是 否 违约 、 违 约 概率 、 有 效 使 用 额度 等 指标 作为 评价 对 象 ， 然 
后 调用 与 此 相关 的 各 种 客户 信息 建立 评估 模型 ， 自 动 计 算 授信 结果 。 

信用 卡 产品 是 循环 授信 产品 。 在 大 数据 技术 的 应 用 下 ， 商 业 银 行 可 以 对 信用 卡 客户 的 
信贷 风险 进行 实时 监控 ， 并 根据 监控 结果 及 时 对 客户 的 授信 额度 做 出 调整 。 具 体 来 讲 ， 大 
数据 技术 可 以 主要 应 用 于 对 信用 卡 客户 的 初始 额度 确定 、 业 务 风险 评估 、 业 务 收益 评估 
之 中 。 


1. 初始 额度 模型 


初始 额度 模型 衡量 的 主要 是 商业 银行 基于 其 信用 卡 客户 的 收益 情况 。 由 于 信用 卡 产品 
是 需要 循环 授信 的 ， 因 此 商业 银行 在 进行 初始 额度 授信 时 ， 除 了 要 考虑 客户 需求 和 还 款 能 
力 之 外 ， 还 会 考虑 客户 的 收益 情况 ， 进 而 其 信贷 资源 会 向 高 收益 客户 倾斜 。 

商业 银行 在 信用 卡 业 务 中 的 主要 收益 来 源 于 其 向 客户 收取 的 循环 利息 、 请 期 利息 、 手 
续费 等 利息 费用 。 因 此 ， 在 初始 额度 模型 中 所 考虑 的 变量 主要 包括 : 客户 属性 (性 别 、 年 
龄 、 学 历 等 )、 还 款 行为 、 逾 期 行为 、 额 度 占用 情况 、 透 支 情况 以 及 客户 在 电 商 平台 上 的 消 
费 行 为 、 分 期 行为 、 浏 览 行为 、 点 击 行为 等 与 客户 相关 的 数据 信息 。 通 常情 况 下 ， 习 惯 分 
期 的 客户 收益 率 较 高 。 

大 数据 技术 在 初始 额度 模型 中 能 够 发 挥 重大 作用 。 在 客户 的 初始 申请 授信 阶段 ， 商 业 
银行 尚未 与 客户 建立 直接 的 业务 关系 ， 基 于 收入 、 负 债 等 基本 信息 难以 对 客户 的 授信 和 需求 
做 出 合理 的 评估 。 商 业 银行 应 用 大 数据 技术 可 以 通过 外 部 客户 的 相关 交易 数据 对 客户 的 消 
费 支出 情况 进行 分 析 ， 从 而 能 够 较为 准确 地 评估 出 客户 的 授信 额度 需求 。 


2. 行为 风险 模型 


行为 风险 模型 是 根据 客户 历史 行为 预测 其 未 来 出 现 坏 账 的 可 能 性 ， 进 而 对 客户 风险 做 
出 全 面 准确 评价 的 模型 。 该 模型 在 商业 银行 的 信用 卡 额度 管理 中 起 到 了 重要 的 作用 。 
在 信用 卡 客户 使 用 信用 卡 的 过 程 中 ， 商 业 银行 能 够 观测 到 客户 更 多 的 行为 。 对 这 些 行 
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为 数据 进行 分 析 和 挖掘 能 够 为 商业 银行 提供 有 效 依据 ， 以 实现 对 客户 所 提供 的 循环 授信 更 
为 准确 有 效 的 动态 调整 。 

目标 变量 由 客户 的 逾期 情况 决定 ， 在 考核 期 内 逾期 天 数 超过 给 定 阔 值 即 为 劣质 客户 ， 
未 发 生 逾 期 或 逾期 天 数 未 超过 规定 天 数 的 为 优质 客户 。 这 里 阔 值 的 确定 是 由 多 方面 因素 所 
决定 的 。 例 如 ， 可 以 根据 逾期 天 数 和 客户 未 来 造成 损失 间 的 相关 性 ， 对 劣质 客户 和 优质 客 
户 进行 区 分 。 或 根据 客户 数据 的 累计 周期 的 长 得， 分别 设 定 阔 值 标准 : 累计 周期 短 ， 逾 期 
天 数 标准 就 越 低 :， 累计 周期 越 长 ， 对 劣质 客户 的 判别 就 更 依赖 客户 的 行为 数据 分 析 而 不 再 
局 限于 逾期 天 数 的 情况 。 

在 行为 风险 模型 中 ， 客 户 行为 的 预测 变量 通常 包括 但 不 限于 以 下 方面 : 客户 的 还 款 行 
为 、 消 费 行为 、 资 金 使 用 情况 、 欠 款 情 况 、 取 现行 为 、 银 联 流水 数据 、 央 行 征 信 数 据 以 及 
客户 在 电 商 平台 上 的 消费 行为 、 浏 览 行为 等 。 

3. 业务 收益 模型 


业务 收益 模型 与 初始 额度 模型 类 似 ， 所 衡量 的 都 是 客户 能 够 为 商业 银行 所 带 来 的 收益 
情况 。 但 业务 收益 模型 的 衡量 对 象 是 商业 银行 的 存量 客户 ， 主 要 用 于 对 其 存量 客户 的 收益 
情况 进行 动态 评估 。 商 业 银 行 的 信贷 资源 通常 会 向 低 风 险 、 高 收益 的 客户 倾斜 ， 并 缩减 分 
配给 高 风险 、 低 收益 客户 的 信贷 资源 。 从 中 我 们 可 以 看 出 ， 在 商业 银行 的 授信 额度 调整 策 
略 中 ， 不 仅 会 考虑 客户 的 行为 风险 ， 还 会 考虑 客户 所 能 带 来 的 收益 。 因 此 ， 将 业务 收益 模 
型 与 行为 风险 模型 相 结 合 ， 有 助 于 商业 银行 保持 合理 的 资产 结构 。 

综 上 所 述 ， 大 数据 对 计量 模型 的 影响 主要 表现 为 以 下 3 个 方面 。 

(1) 大 数据 提高 了 计量 模型 的 信息 完备 性 。 

(2) 大 数据 提高 了 计量 模型 的 精益 化 程度 。 

(3) 大 数据 使 计量 模型 和 业务 决策 的 过 程 更 加 及 时 、 结 果 更 新 更 为 频繁 。 


3.3.3 ”案例 一 大 数据 为 商业 银行 信贷 管理 提供 更 多 可 能 

1. 商业 银行 开始 意识 到 大 数据 的 重要 作用 

2012 年 中 国 建设 银行 “ 善 融 商务 ”的 率先 上 线 ， 为 大 型 商业 银行 涉足 电 商 领域 拉 开 了 
帷幕 。 随 后 ， 中 国 交 通 银行 的 “ 交 博 汇 ”、 中 国 银 行 的 “ 云 购 物 ” 和 中 国 工 商 银行 的 “ 融 
e 购 ” 纷 至 者 来 。 目前， 几乎 所 有 的 银行 系 电 商 都 声称 ， 免 平台 费 、 免 技术 维护 费 、 免 交 
易 佣金 费 。 而 这 些 “ 免 费 ” 的 背后 ， 是 银行 朝 思 暮 想 的 数据 信息 。 

为 获得 客户 的 真实 数据 ， 银 行 往往 要 进行 大 量 线 下 调查 工作 ， 成 本 巨大 。 与 电 商 合作 
只 能 得 到 信息 的 分 析 结 果 ， 但 银行 更 希望 自己 做 电 商 获得 一 手数 据 。 电 子 商务 平台 上 积累 
的 大 量 数 据 ， 比 如 消费 者 的 搜索 、 比 价 、 商 户 流水 等 ， 能 够 转化 为 银行 评级 、 授 信 的 数 
据 ， 会 对 银行 发 展 潜在 客户 、 规 避 信 贷 风 险 起 到 重要 作用 。 

2. 商业 银行 纷纷 推出 小 微 企业 大 数据 产品 系列 贷款 


中 国 建设 银行 为 资金 周转 困难 、 受 限于 贷款 烦琐 手续 的 小 微 企业 主推 出 了 小 微 企业 大 
数据 产品 系列 贷款 。 九 大 系列 产品 包括 小 微 快 贷 、 税 易 贷 、 善 融 贷 、 结 算 透 、 信 用 贷 、 创 
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业 贷 、POS 贷 、 薪 金 贷 、 善 融 e 贷 。 大 数据 信贷 产品 是 建设 银行 运用 大 数据 技术 ， 对 小 微 
企业 客户 的 结算 、 交 易 、 存 款 、 资 产 数据 、 信 用 记录 等 信息 进行 分 析 判 断 、 主 动 挖 掘 和 营 
销 发 放 的 信用 贷款 ， 具 有 小 额 化 、 标 准 化 、 综 合 化 、 集 约 化 、 智 能 化 的 特点 。 


3. 大 数据 时 代 的 机 遇 和 挑战 


伴随 科技 的 发 展 ， 移 动 互联 的 浪潮 测 涌 而 来 ， 大 数据 、 云 计算 等 科技 因素 不 仅 可 以 支 
持 银行 提高 效率 、 降 低 成 本 ， 持 续 激增 的 数据 还 能 迫使 银行 寻求 新 的 方法 来 采集 、 整 理 数 
据 ， 助 推 金融 创新 。 各 大 银行 对 大 数据 的 争夺 风 生 水 起 ， 然 而 过 程 中 可 能 产生 的 数据 造假 
问题 也 不 容 小 舰 。 大 数据 固然 能 降低 商业 银行 的 交易 成 本 ,但 也 能 降低 客户 的 造假 成 本 。 
例如 ，POS 贷 本 应 基于 “真实 贸易 交易 ”用 户 的 信息 ， 但 在 实际 操作 过 程 中 ， 也 可 能 存在 
个 别 商户 为 了 提高 贷款 人 额度， 进行 “流水 造假 ”的 现象 。 


(OE 风险 管理 


风险 管理 是 指 企业 在 其 日 常 经 营 活动 中 努力 将 风险 降 到 最 低 的 管理 过 程 。 在 这 一 管理 
过 程 中 ， 企 业 需 要 对 其 所 面临 的 风险 进行 认识 、 度 量 和 分 析 ， 通 过 科学 决策 选择 出 最 为 有 
效 的 风险 管理 途径 和 方法 ， 力 图 通过 具有 主动 性 、 目 的 性 和 计划 性 的 风险 防 控 行为 ， 以 最 
小 的 成 本 获取 最 大 的 安全 保障 。 有 效 的 风险 管理 活动 能 够 帮助 商业 银行 降低 损失 出 现 的 概 
率 、 缩 小 损失 的 影响 范围 ， 进 而 提高 其 经 营 能 力 和 市 场 价值 。 

近年 来 ， 互 联网 金融 的 迅猛 发 展 给 传统 金融 机 构 带 了 极 大 的 挑战 。 商 业 银行 在 过 去 主 
要 以 中 国人 民 银 行 所 提供 的 征 信 信 息 和 客户 所 提供 的 基础 信息 为 主要 的 风 控 信 息 来 源 ， 以 
专家 经 验 为 风险 管理 决策 的 评判 方法 ， 过 于 倚重 定性 分 析 可 能 会 错失 部 分 有 效 客户 ， 不 利 
于 其 业务 的 开展 。 随 着 移动 互联 网 的 普及 ， 人 们 的 日 常 活动 越 来 越 多 地 在 网 络 上 留 下 痕 
迹 ， 这 些 痕迹 可 以 以 电子 数据 的 形式 存储 下 来 。 有 越 来 越 多 的 商业 银行 开始 运用 大 数据 技 
术 对 客户 行为 进行 获取 和 分 析 ， 以 对 其 风险 控制 活动 进行 有 效 的 补充 。 

商业 银行 所 面临 的 风险 包括 : 信用 风险 、 操 作风 险 、 市 场 风险 、 流 动 性 风险 、 利 率 风 
险 、 法 律 风险 等 。 其 中 信用 风险 是 商业 银行 所 面临 的 最 主要 的 风险 。 因 此 ， 下 面 主要 针对 
信用 风险 管理 进行 阐述 。 


3.4.1 大 数据 风险 控制 与 传统 风险 控制 的 区 别 


随 着 移动 互联 网 时 代 的 来 临 ， 人 们 在 网 络 上 所 留 下 的 行为 印记 越 来 越 多 ， 这 些 类 型 多 
种 多 样 的 印记 作为 数据 被 存储 下 来 ， 已 经 成 为 金融 机 构 金 融 风 险 控 制 的 重要 补充 手段 。 运 
用 大 数据 进行 风险 控制 能 够 很 好 地 弥补 传统 风险 控制 所 存在 的 信息 不 对 称 、 数 据 获取 维度 
窗 、 人 工 采集 成 本 高 、 效 率 低 等 缺点 。 


1. 大 数据 风险 控制 与 传统 风险 控制 间 的 差异 


1) ”传统 风险 控制 
传统 风险 控制 流程 如 图 3.7 所 示 。 在 用 户 提交 申请 表 后 ， 商 业 银 行 首先 要 查询 客户 的 
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征 信 情 况 ; 由 录 单 员 负 责 ， 将 申请 表 中 的 客户 信息 录入 系统 ， 并 另行 登记 审批 进度 表 ; 之 
后 将 客户 申请 资料 随 征 信 资 料 派 给 审核 员 ; 审核 员 通 过 阅读 征 信 资 料 、 查 询 信用 网 、 工 商 
信息 、 与 第 三 方 核实 申请 资料 和 确认 申请 人 真实 性 等 审核 步骤 后 ， 记 录 存 在 的 疑点 ;电话 
联系 客户 ， 对 审核 中 发 现 的 疑点 进行 核实 ; 之 后 对 申请 人 进行 实地 考察 ， 咨 询 其 经 营 模 
式 、 营 业 收 入 等 问题 ， 对 其 经 营 场所 、 经 营 状况 等 信息 进行 核实 ; 在 贷款 分 析 环 节 ， 结 合 
之 前 进行 的 调查 情况 撰写 调查 报告 ， 给 出 审批 意见 ， 进 而 结合 审批 意见 ， 做 出 信贷 决策 ; 
通知 审核 通过 的 客户 来 行进 行 签 约 ， 在 签约 的 过 程 中 要 进行 复核 相关 资料 的 原件 、 核 实 客 
户 流水 情况 等 流程 ， 在 放款 给 客户 后 ， 对 相关 文件 进行 归档 ;在 客户 借款 期 间 ， 要 做 好 贷 
后 管理 ， 包 括 电 话 回访 、 通 知 还 款 、 催 收 、 续 贷 等 业务 活动 。 从 中 可 以 看 到 ， 传 统 的 风险 
控制 流程 十 分 烦琐 ， 复 杂 的 流程 无 疑 会 导致 业务 办 理 的 低 效 率 。 
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3.7 ”传统 风险 控制 流程 


2) ”大 数据 风险 控制 

大 数据 风险 控制 流程 如 图 3.8 所 示 。 具 体 来 说 ， 在 大 数据 风险 控制 中 ， 客 户 通常 从 网 
页 端口 或 手机 客户 端口 (这 些 端口 也 就 是 数据 采集 的 入 口 ) 进 入 贷款 申请 系统 ， 商 业 银 行 在 
获得 客户 授权 指令 后 ， 利 用 其 系统 内 和 第 三 方 的 相关 客户 信息 数据 对 客户 进行 征 信 : 首先 
是 对 客户 身份 进行 验证 ， 并 对 其 进行 黑 名 单 检 查 ， 之 后 利用 客户 的 交易 行为 数据 、 社 交 数 
据 、 教 育 数据 、 运 营 商 数据 、 电 商 数 据 、 公 积 金 数据 、 社 保 数据 等 相关 数据 对 客户 的 信用 
风险 进行 分 析 和 评估 ; 在 评估 结果 的 基础 之 上 ， 生 成 该 客户 的 资信 报告 ， 基 于 资信 报告 做 
出 授信 决策 ， 并 向 客户 发 放贷 款 ， 在 客户 借款 期 间 ， 在 与 客户 保持 联系 的 基础 上 ， 依 据 事 
先 设 定好 的 催收 模型 和 催收 策略 对 客户 的 信用 风险 进行 实时 监控 。 从 中 可 以 看 到 ， 大 数据 
风险 控制 的 基本 流程 与 传统 风险 控制 大 致 相同 ， 但 在 接受 客户 申请 、 对 客户 进行 资信 评 
估 、 做 出 授信 决策 、 进 行 贷 后 管理 环节 比 传统 风险 控制 更 加 快捷 高 效 。 
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用 。 


质 、 


客户 申请 
本 十 二 业 
一 身份 验证 
| | 三 黑 名 单 检查 | 人 
二 
资信 评 值 运营 南 数据 人 
| 三 电 商 数据 | 
| 公积金 数据 
资信 报告 _ 一 社保 数据 . 授信 决策 
图 3.8 ”大 数据 风险 控制 流程 
3) 二 者 之 间 的 差异 


大 数据 风险 控制 与 传统 风险 控制 最 主要 的 差异 体现 在 大 数据 技术 在 客户 征 信 环 节 的 运 


大 数据 征 信 与 传统 征 信 的 不 同 主要 体现 在 以 下 6 个 方面 。 


(1) 数据 来 源 不 同 。 传 统 征 信 的 数据 以 银行 信用 数据 为 主 ， 来 源 单一 ， 采 集 的 频率 相 
对 较 低 。 而 大 数据 征 信 的 数据 来 源 广泛 ， 包 括 : 用 户 提交 的 数据 ， 如 其 职业 背景 、 受 教育 
程度 等 ， 第 三 方 数据 ， 如 理财 数据 、 电 商 平台 数据 、 社 交 平 台数 据 、 社 保 数据 、 公 积 金 数 
据 等 其 他 相关 数据 ;此 外 ， 大 数据 征 信 的 信息 采集 频率 高 ， 能 够 实现 对 数据 的 实时 采集 。 
(2) 数据 格式 不 同 。 传 统 征 信 所 采用 的 数据 主要 是 格式 化 数据 ， 而 大 数据 征 信 所 采用 
的 数据 既 包 括 格式 化 数据 ， 也 包括 大 量 的 非 格式 化 数据 。 
(3) 评价 思路 不 同 。 传 统 征 信 是 通过 客户 历史 信用 记录 来 评价 客户 信用 水 平 的 ， 而 大 
数据 征 信 则 不 仅 对 客户 的 历史 信用 数据 进行 考量 ， 还 会 从 海量 数据 中 推断 客户 的 身份 特 


性 格 偏好 、 经 济 能 力 等 相对 稳定 的 指标 ， 从 而 对 客户 的 信用 水 平 做 出 判断 。 


(4) 分 析 方 法 不 同 。 传 统 征 信 所 采用 的 分 析 方法 主要 是 线性 回归 、 聚 类 分 析 和 分 类 树 
等 方法 ;， 而 大 数据 征 信 所 采用 的 是 机 器 学 习 、 神 经 网 络 、Page Rank 算法 、RF 等 大 数据 处 
理 方法 。 


(5) 服务 人 群 不 同 。 传 统 征 信 的 服务 范围 仅 限于 有 信贷 记录 的 客户 ， 服 务 范围 小 ; 


而 


大 数据 征 信 的 服务 范围 不 仅 包 括 有 信贷 记录 的 人 群 ， 还 包括 那些 没有 信贷 记录 但 在 生活 中 
留 下 足够 多 痕迹 的 客户 ， 服 务 范围 大 幅 拓展 。 


(6) 应 用 场景 不 同 。 传 统 征 信 通 常 只 能 应 用 于 金融 领域 ， 而 大 数据 征 信 不 仅 能 应 用 


金融 领域 ， 还 能 在 多 种 生活 领域 发 挥 其 使 用 价值 。 


2. 大 数据 风险 控制 的 优势 


大 数据 风险 控制 的 优势 主要 体现 在 大 数据 征 信 的 利用 价值 上 。 
(1) 使 商业 银行 的 客户 信用 风险 评估 纳入 了 多 样 化 的 行为 数据 ， 这 些 数据 获 盖 范围 


于 


广 


泛 且 具有 实时 性 。 依 托 于 大 数据 和 云 计算 技术 的 优势 ， 可 以 对 所 收集 到 的 海量 数据 进行 充 
分 挖掘 ， 从 而 使 商业 银行 的 客户 行为 风险 模型 不 断 迭 代 优 化 。 
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(2) 在 大 数据 风险 控制 中 ， 信 用 评价 更 加 精准 。 由 于 大 数据 征 信 模型 中 客户 数据 的 范 
围 越 来 越 大 、 数 据 维度 越 来 越 广 ， 客 户 信用 评估 模型 越 来 越 多 ， 因 而 依据 大 数据 征 信 模 型 
所 做 出 的 信用 评价 更 加 精准 和 高 效 。 

(3) 大 数据 风险 控制 中 对 客户 信用 的 评判 更 具 时 效 性 。 大 数据 所 具备 的 数据 采集 和 计 
算 能 力 可 以 帮助 商业 银行 基于 多 维度 、 全 方面 的 客户 数据 以 及 具备 自我 学 习 能 力 的 风险 控 
制 模型 ， 获 取 实 时 计算 出 的 评估 结果 ， 进 而 使 其 风险 量化 能 力 得 以 大 幅 提高 。 


3.4.2 ”基于 大 数据 的 银行 风险 管理 模式 
1. 基于 大 数据 的 银行 风险 管理 模式 所 具有 的 特点 


1) ”集约 化 管理 

在 大 数据 技术 的 应 用 下 ， 商 业 银 行 触及 客户 的 方式 发 生 了 极 大 的 变化 ， 其 在 对 客户 信 
用 风险 进行 管理 时 无 须 以 现场 直接 接触 的 方式 接触 、 服 务 和 管理 客户 ， 而 是 以 电话 联系 、 
网 络 在 线 沟通 、 移 动 智能 设备 客户 端 等 方式 与 客户 进行 互动 ， 进 而 有 效 地 降低 了 运营 成 
本 。 此 外 ， 由 于 业务 流程 更 加 标准 化 ， 在 保证 提高 业务 质量 的 同时 ， 商 业 银 行 的 服务 效率 
也 得 到 了 提升 ， 从 而 能 够 更 好 地 在 控制 风险 的 基础 上 向 不 同 的 客户 群 提供 其 所 需 的 金融 
服务 。 

2) ”全 过 程 风 控 

商业 银行 基于 对 大 数据 技术 的 应 用 ， 能 够 在 其 风险 管理 系统 中 接 入 海量 集中 式 数 据 ， 
这 些 多 维度 数据 的 交叉 验证 ， 能 够 解决 商业 银行 在 客户 信用 风险 评估 中 客户 信息 难以 收集 
的 问题 ， 从 而 有 效 地 缓解 了 商业 银行 在 信贷 业务 中 所 面临 的 信息 不 对 称 的 问题 ， 提 高 了 商 
业 银 行 对 客户 信用 风险 的 识别 和 预防 能 力 。 

此 外 ， 基 于 对 大 数据 技术 的 利用 ， 商 业 银 行 的 贷 后 管理 能 力也 得 到 了 提升 ， 尤 其 是 非 
现场 的 贷 后 管理 能 力 得 到 了 大 幅 提高 。 在 大 数据 技术 的 应 用 下 ， 商 业 银行 的 风险 控制 以 非 
现场 的 预警 监测 为 依托 ， 对 不 同 客户 群 的 风险 特征 和 行为 模式 进行 识别 ， 强 调 对 授信 客户 
进行 持续 跟踪 、 动 态 监测 和 实时 预警 。 

3) ”标准 化 与 差异 化 相 结合 

虽然 商业 银行 所 提供 的 信贷 产品 具有 一 定 的 标准 化 特征 ， 但 在 其 风险 管理 过 程 中 也 同 
样 会 考虑 如 何 对 差异 进行 处 理 。 根 据 数据 分 析 和 市 场 调研 的 结果 ， 商 业 银 行 可 以 针对 不 同 
行业 、 不 同 地 区 、 不 同 特征 的 客户 群 制定 不 同 的 标准 化 产品 ， 并 分 别 采 用 不 同 的 运作 流 
程 、 审 核 标准 、 评 分 卡 和 授信 策略 。 在 集约 化 的 风险 管理 下 ， 商 业 银 行 可 以 在 不 断 的 学 习 
和 测试 过 程 中 ， 对 其 经 营 策略 进行 细 分 和 调整 。 

4) ”输入 信息 多 样 化 

在 大 数据 技术 的 应 用 下 ， 越 来 越 多 的 外 部 信息 也 被 纳入 商业 银行 的 风险 评估 系统 。 在 
对 外 部 信息 进行 标准 化 处 理 后 ， 信 息 数 据 之 间 所 进行 的 交叉 验证 能 够 在 结合 各 个 客户 群 特 
征 的 基础 上 进行 优化 。 随 着 外 部 输入 信息 的 范围 越 来 越 广 、 数 据 量 越 来 越 大 、 数 据 变化 频 
率 越 来 越 快 以 及 数据 类 型 愈加 多 样 化 ， 商 业 银行 的 风险 管理 系统 在 数据 处 理 、 数 据 分 析 、 
模型 建立 、 策 略 应 用 等 方面 的 能 力也 在 不 断 增 强 。 
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2. 信贷 审批 

信贷 审批 是 商业 银行 进行 风险 管理 的 重要 环节 。 随 着 社会 的 不 断 发 展 和 商业 银行 同业 
间 的 竞争 加 剧 ， 商 业 银 行 在 进行 信贷 审批 时 越 来 越 注 重 客户 的 体验 。 例 如 ， 提 供 更 加 简便 
的 贷款 申请 流程 、 更 快速 的 审批 结果 反馈 、 更 公开 透明 的 贷款 受理 过 程 等 都 是 提升 客户 审 
批 体验 的 主要 表现 。 在 保证 风险 控制 水 平和 能 力 的 基础 上 ， 提 升 客户 的 审批 体验 离 不 开 大 
数据 技术 的 应 用 。 

1) ”实时 审批 

实时 审批 是 自动 化 审批 的 一 种 类 型 ， 是 指 从 获取 申请 信息 开始 ， 通 过 接 入 外 部 数据 并 
进行 比 对 、 规 则 判断 、 信 用 调查 和 模型 评估 ， 到 最 终 给 出 授信 决策 ， 在 保证 决策 质量 的 前 
提 下 整个 过 程 是 在 极 短 的 时 间 内 完成 的 。 

为 了 实现 实时 审批 ， 商 业 银 行 需要 对 其 审批 流程 进行 优化 ， 减 少 人 工 干预 的 必要 性 ， 
还 需要 对 其 非 人 工 环节 的 运行 效率 进行 提高 。 具 体 来 讲 ， 就 是 要 让 数据 、 模 型 和 策略 更 多 
地 代替 人 工 做 出 判断 ， 并 对 信息 技术 进行 革新 ， 以 智能 决策 模型 和 策略 进行 操作 。 例 如 ， 
在 有 效 信息 足够 完备 的 情况 下 ， 利 用 第 三 方 的 数据 信息 就 可 以 对 客户 的 申请 信息 进行 校 验 
和 补充 ， 无 须 工作 人 员 再 电话 联系 客户 核实 信息 的 真实 性 和 完整 性 。 

大 数据 是 实时 审批 的 根本 。 在 大 数据 技术 的 作用 下 ， 客 户 所 提交 的 申请 资料 得 以 简 
化 ， 使 客户 的 审批 体验 得 到 了 有 效 的 提升 。 此 外 ， 商 业 银 行 基于 大 数据 技术 也 不 再 单纯 依 
靠 客户 所 提交 的 信息 对 客户 的 信用 风险 进行 评估 ， 而 通过 分 析 其 他 渠道 获取 的 真实 数据 所 
得 出 的 评估 结果 无 疑 更 为 有 效 。 

2) ”前 置 审批 

利用 大 数据 技术 ， 商 业 银 行 可 以 结合 多 个 渠道 的 客户 数据 ， 在 客户 提交 信贷 申请 前 就 
对 客户 的 风险 水 平 做 出 评估 ， 预 先 做 出 授信 的 决策 ， 即 将 审批 过 程 前 置 。 如 此 一 来 ， 商 业 
银行 的 工作 人 员 根 据 审批 合格 的 客户 名 单 有 针对 性 地 接触 这 些 优质 客户 ， 只 要 该 客户 提出 
授信 申请 便 能 直接 与 商业 银行 建立 起 信贷 业务 关系 。 从 中 可 以 看 出 ， 前 置 审批 既是 风险 控 
制 过 程 的 一 部 分 ， 也 是 营销 环节 的 一 部 分 。 

大 数据 技术 在 前 置 审批 过 程 中 的 作用 表现 为 两 个 方面 : 一 是 能 够 使 商业 银行 在 对 客户 
风险 进行 评估 时 使 用 到 更 加 全 面 的 数据 ， 从 而 做 出 合理 的 授信 决策 ， 二 是 能 够 使 商业 银行 
对 客户 的 信贷 需求 做 出 准确 的 预测 ， 从 而 在 恰当 的 时 机 为 客户 提供 信贷 服务 。 

3) ” 隐 性 审批 

隐 性 审批 主要 存在 于 消费 金融 领域 ， 即 在 客户 进行 消费 付款 时 ， 及 时 为 该 客户 提供 消 
费 贷款 ， 无 须 客户 专门 提交 授信 申请 。 隐 性 审批 过 程 有 以 下 3 个 突出 特点 。 

(1) 隐 性 审批 有 很 强 的 应 用 场景 。 隐 性 审批 通常 与 存在 客户 借款 需求 的 应 用 需求 相 联 
系 ， 发 生 于 该 客户 在 该 场景 中 的 付款 过 程 之 中 。 基 于 该 应 用 场景 ， 商 业 银 行 能 够 获取 借款 
客户 的 资金 用 途 信息 ， 从 而 保证 了 信贷 资金 使 用 的 真实 性 ， 是 对 客户 资信 状况 的 有 效 
补充 。 

(2) 在 这 一 过 程 中 ， 授 信 申 请 、 授 信 审 批 、 放 款 和 交易 紧密 地 衔接 在 一 起 。 即 客户 在 
发 生 交 易 行 为 时 并 未 感受 到 其 授信 申请 行为 ， 授 信 审 批 和 款项 的 拨付 都 集成 在 客户 的 支付 
行为 当中 。 
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(3) 维护 商 圈 的 过 程 就 是 寻找 客户 的 过 程 。 在 隐 性 审批 的 过 程 中 ， 商 业 银 行 只 需要 找 
到 客户 集中 的 商 圈 便 可 以 轻松 引入 优质 的 借款 客户 。 

大 数据 技术 的 优势 作用 主要 体现 在 隐 性 审批 时 ， 商 业 银行 对 其 借款 客户 的 风险 和 收益 
水 平 的 实时 评估 之 中 。 利 用 更 能 反映 客户 消费 能 力 和 经 营 状况 的 第 三 方 数据 对 客户 进行 评 
估 ， 所 得 出 的 评估 结果 更 加 贴 合 客户 的 真实 情况 。 依 托 于 大 数据 的 手机 和 存储 ， 营 销 和 审 
批 环 节 更 为 紧密 地 结合 在 一 起 ， 使 商业 银行 在 提高 营销 效率 的 同时 ， 也 提高 了 其 风险 管理 
东平 。 

4) 移动 审批 

随 着 移动 互联 网 技术 的 发 展 ， 越 来 越 多 的 客户 选择 在 网 页 端口 和 移动 设备 客户 端口 提 
交 授 信 申 请 ， 借 助 大 数据 技术 的 后 端 审批 环节 也 随 之 发 生 了 不 小 的 变化 。 

首先 ， 移 动 审批 实现 了 客户 信息 的 实时 传递 。 即 客户 在 接 入 端口 填写 申请 信息 时 ， 所 
填写 的 申请 信息 被 实时 传递 给 后 端的 审批 系统 。 其 次 ， 移 动 审批 实现 了 更 多 的 信息 采集 。 
基于 对 大 数据 技术 的 应 用 ， 客 户 在 申请 过 程 中 相关 数据 也 会 被 系统 所 采集 ， 如 填写 时 间 、 
修改 内 容 、 修 改 次 数 、 提 交 时 间 等 信息 数据 。 最 后 ， 移 动 审批 的 审批 过 程 延 伸 至 申请 端 。 
即 客户 在 填写 授信 申请 时 ， 每 填写 一 条 信息 ， 该 信息 就 被 实时 地 传递 到 后 台 进 行 核实 ， 客 
户 无 须 完 成 全 部 的 申请 过 程 就 能 得 到 审批 的 反馈 。 


3. 风险 预警 


1) ”风险 预警 的 概念 

风险 预警 是 指 通过 信息 的 收集 和 分 析 ， 对 业务 和 资产 的 风险 状况 进行 识别 、 测 量 和 分 
析 ， 并 对 可 能 发 生 的 风险 采取 适当 措施 进行 化 解 ， 以 达到 减少 损失 的 目的 。 商 业 银行 对 风 
险 进行 预警 ， 可 以 及 时 地 采取 有 针对 性 的 措施 对 未 来 将 会 发 生 的 损失 进行 控制 。 大 数据 在 
风险 预警 方面 极 具 优势 。 商 业 银 行 借助 大 数据 技术 可 以 从 多 渠道 选取 监控 指标 ， 对 其 经 营 
过 程 中 每 一 个 业务 的 每 一 个 环节 的 异动 进行 跟踪 ， 从 而 实现 


对 风险 的 有 效 预警 。 
风险 预警 是 一 个 动态 过 程 。 在 风险 预警 的 动态 过 程 中 ， © 


主动 监测 并 化 解 风险 是 其 主要 目的 ， 预 警 是 实现 该 目的 的 手 大 
段 。 风 险 预 警 流程 如 图 3.9 所 示 。 从 图 中 可 以 看 到 ， 风 险 预 预 徊 
警 是 一 个 闭环 过 程 ， 通 过 发 现 问题 和 解决 问题 的 循环 往复 实 他 


现 对 风险 的 动态 管理 。 在 这 一 过 程 中 ， 监 测 环节 是 对 风险 进 af 
行 识别 的 环节 ， 有 效 的 监测 识别 决定 了 风险 预警 的 准确 性 和 
及 时 性 ; 预警 是 触发 风险 处 置 措施 的 环节 ， 而 归 因 分 析 则 是 


采取 恰当 处 置 措施 的 必要 前 提 ， 在 对 当前 所 发 现 的 风险 进行 。 图 39 风险 预警 流 各 
处 置 后 ， 当 即 进入 下 一 轮 的 风险 监测 环节 ， 以 发 现 新 的 或 变 
得 更 加 严重 的 风险 问题 。 

2) ”风险 预警 体系 

健全 的 风险 预警 体系 是 及 时 且 全 面 的 。 

风险 预警 体系 的 及 时 性 体现 在 以 下 两 个 方面 。 
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(1) 风险 预警 信号 具有 前 瞻 性 和 预见 性 。 即 风险 预警 信号 能 够 帮助 商业 银行 及 时 识别 
早期 的 风险 迹象 ， 避 免 因 预警 信号 存在 滞后 性 导致 其 承担 较 大 的 损失 。 

(2) 及 时 对 风险 预警 信号 做 出 反应 。 即 商业 银行 在 收 到 风险 预警 信号 后 ， 必 须 有 能 力 
对 所 发 现 的 风险 迹象 以 化 解 风险 、 减 少 损失 为 出 发 点 采取 快速 的 应 对 行动 。 

风险 预警 体系 的 全 面 性 体现 在 以 下 两 个 方面 。 

(1) 既 要 关注 单一 客户 ， 也 要 关注 客户 整体 。 即 商业 银行 对 风险 预警 信号 的 识别 要 才 
盖 到 每 一 个 客户 个 体 ， 也 要 对 整体 的 客户 结构 和 资产 质量 给 予 充分 的 关注 。 

(2) 既 要 细 化 到 单一 业务 ， 也 要 覆盖 全 部 的 业务 范畴 。 即 商业 银行 不 仅 要 对 微观 层面 
的 单一 业务 进行 预警 ， 还 要 在 宏观 层面 对 全 部 业务 的 各 种 风险 进行 有 效 的 预警 和 防范 。 

根据 预警 类 型 的 不 同 ， 可 以 将 风险 预警 分 为 个 案 预 警 和 资产 组 合 预警 。 个 案 预 警 是 指 
对 某 一 客户 个 体 的 信用 状况 的 监测 和 预警 ， 而 资产 组 合 预警 可 以 是 对 某 一 业务 的 资产 质量 
的 评估 和 预警 ， 也 可 以 是 对 由 多 种 业务 所 组 成 的 整体 资产 状况 的 评估 和 预警 。 通 常情 况 
下 ， 个 案 预 警 是 资产 组 合 预警 的 前 兆 ， 因 此 可 以 在 二 者 之 间 建 立 恰当 的 预警 联动 机 制 。 

3) “分 级 预警 机 制 

分 级 预警 机 制 是 指 基于 预警 信号 的 严重 程度 和 所 需 响应 速度 的 不 同 ， 在 预警 体系 内 设 
置 不 同 的 预警 级 别 ， 以 对 每 个 预警 信号 做 出 恰当 的 反应 。 风 险 预警 信号 的 分 级 如 图 3.10 所 
示 。 不 论 是 哪 一 级 别 的 预警 信 号 ， 都 需要 进行 相应 的 归 因 分 析 ， 在 找到 预警 原因 的 基础 上 
采取 适当 的 措施 对 风险 进行 必要 的 控制 。 而 分 级 的 意义 在 于 ， 商 业 银行 可 以 根据 预警 信号 
的 级 别 来 确定 处 置 措 施 的 实施 范围 和 实施 进度 。 


图 3.10 ”风险 预警 信号 的 分 级 


4) ”大 数据 在 风险 预警 中 的 作用 

为 提高 预警 信息 的 及 时 性 和 全 面 性 ， 商 业 银 行 的 预警 信号 获取 范围 已 经 扩展 到 了 外 
部 ， 而 且 从 传统 的 公共 记录 扩展 到 了 无 限 的 网 络 世界 当中 。 互 联网 大 数据 具有 非常 广 的 数 
据 范 围 和 非常 高 的 数据 更 新 频率 ， 因 而 基于 互联 网 中 快速 更 新 的 海量 信息 的 输入 ， 商 业 银 
行 的 预警 能 力 得 到 了 极 大 的 提高 。 在 这 一 高 效 运行 的 风险 预警 体系 下 ， 客 户 任 一 异常 的 行 
为 都 会 被 及 时 地 识别 出 来 ， 并 将 作为 风险 预警 信号 实时 传递 给 客户 经 理 ， 客 户 经 理 将 会 根 
据 该 预警 信号 的 严重 程度 采取 相应 的 处 置 措 施 ， 及 时 对 客户 的 异常 情况 进行 排查 。 


4. 逾期 管理 


商业 银行 是 经 营 风险 的 企业 ， 因 而 客户 逾期 的 发 生 难以 避免 。 因 客户 逾期 所 造成 的 坏 
账 损失 是 商业 银行 主要 运营 成 本 的 一 部 分 ， 而 因 客 户 逾 期 所 收取 的 逾期 利息 和 相关 费用 又 
形成 了 商业 银行 的 收入 。 正 因 如 此 ， 对 逾期 客户 进行 管理 是 商业 银行 风险 管理 的 重要 组 成 
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部 分 。 

1) ”客户 逾期 的 发 生 

客户 逾期 的 主要 原因 可 分 为 : 还 款 意愿 差 和 还 款 能 力 不 足 两 个 方面 。 其 中 还 款 能 力 不 
足 是 客户 发 生 逾 期 最 为 主要 的 原因 ， 通 常 可 以 分 为 以 下 3 种 情况 。 

(1) 客户 出 现 临时 性 的 资金 周转 困难 。 若 该 类 客户 的 还 款 意愿 良好 ， 则 其 预期 的 时 间 
不 会 太 长 ， 银 行 所 面临 的 坏账 风险 相对 较 小 。 

(2) 经 济 状况 恶化 导致 的 还 款 能 力 不 足 。 该 类 客户 的 坏账 风险 相对 较 高 。 

(3) 贷款 金额 超过 其 自身 的 承受 能 力 。 该 类 客户 也 同样 具有 较 高 的 坏账 风险 。 

商业 银行 利用 大 数据 技术 能 够 从 多 种 渠道 获取 客户 的 相关 信息 ， 从 而 能 够 在 事前 对 存 
在 逾期 风险 的 客户 进行 有 效 识别 。 

2) ”客户 逾期 的 处 置 

对 逾期 客户 的 管理 主要 包括 : 不 良 资产 处 置 、 逾 期 催收 管理 、 失 联 客户 管理 和 逾期 信 
息 管理 。 其 中 不 良 资产 处 置 和 逾期 催收 管理 是 最 主要 的 两 个 任务 。 

(1) 不 良 资产 处 置 。 不 良 资产 处 置 是 指 通 过 不 良 资产 核 销 、 不 良 资产 打包 出 售 等 方 
式 ， 对 逾期 客户 所 形成 的 呆账 、 坏 账 进行 处 理 ， 以 优化 银行 资产 结构 的 过 程 。 其 中 不 良 资 
产 核 销 是 商业 银行 处 置 其 不 良 资产 最 常见 的 方式 。 

(2) 逾期 催收 管理 。 逾 期 催收 管理 是 指 商业 银行 通过 采取 不 同 的 方式 触及 客户 并 实现 
欠 款 催 回 ， 同 时 对 风险 状况 不 断 恶 化 的 客户 采取 相应 的 措施 ， 以 防范 风险 敞 口 的 进一步 扩 
大 ， 降 低 商业 银行 可 能 损失 的 过 程 。 常 见 的 催收 方式 包括 : 短信 催收 、 电 话 催收 、 实 地 催 
收 、 司 法 催收 等 。 其 中 ， 司 法 催收 的 强度 最 高 ， 所 需 运 营 成 本 也 最 高 ， 短信 催 收 的 强度 最 
弱 ， 所 需 运营 成 本 也 最 低 。 

(3) 失 联 客户 管理 。 客 户 失 联 是 逾期 客户 管理 中 最 常见 的 问题 。 在 当前 的 新 兴 金 融 模 
式 下 ， 商 业 银行 利用 大 数据 技术 ， 可 以 对 客户 的 海量 数据 进行 搜集 和 传递 ， 精 准 地 刻画 出 
客户 的 个 人 特征 、 行 为 方式 和 社交 网 络 ， 进 而 使 其 进行 真实 性 核查 和 风险 评估 的 能 力 得 到 
大 幅 提 高 。 在 逾期 失 联 客户 的 管理 方面 ， 大 数据 的 作用 主要 体现 为 以 下 两 点 : 一 是 可 以 帮 
助 商业 银行 提前 对 失 联 客户 进行 识别 ， 并 在 客户 失 联 之 前 对 客户 的 联系 信息 进行 及 时 更 
新 ， 二 是 可 以 帮助 商业 银行 利用 互联 网 中 所 积累 的 大 量 关 联 信 息 对 失 联 客户 的 信息 进行 有 
效 修复 。 

(4) 逾期 信息 管理 。 逾 期 信息 是 客户 风险 预测 的 数据 来 源 ， 对 逾期 数据 进行 管理 有 助 
于 商业 银行 对 客户 的 风险 和 收益 情况 做 出 准确 的 评价 ， 确 定 其 在 客户 引入 和 客户 管理 方面 
的 具体 方向 。 在 逾期 管理 阶段 通过 跟踪 监测 ， 可 以 及 时 地 发 现 客户 、 流 程 、 授 信 决 策 等 方 
面 的 问题 。 并 且 通 过 对 逾期 客户 管理 过 程 进行 检测 ， 可 以 提高 商业 银行 的 运营 效率 。 

3) ”逾期 催收 的 计量 模型 

逾期 催收 的 计量 模型 是 对 逾期 客户 进行 分 类 的 重要 依据 ， 商 业 银行 可 以 利用 计量 模型 
对 客户 的 风险 情况 进行 识别 ， 进 而 对 不 同 风险 程度 的 客户 采取 不 同 的 催收 策略 和 手段 。 有 
效 的 催收 策略 能 够 在 提高 欠 款 回收 率 的 基础 上 ， 降 低 商 业 银 行 的 催收 成 本 。 常 见 逾 期 催收 
计量 模型 包括 : 客户 逾期 行为 模型 、 账 龄 滚动 率 模型 和 失 联 模型 。 
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(1) 客户 逾期 行为 模型 。 

逾期 行为 模型 主要 用 来 对 客户 未 来 发 生 逾 期 行为 的 可 能 性 进行 预测 。 由 于 客户 发 生 逾 
期 行为 通常 都 有 一 定 的 表现 期 ， 因 而 客户 逾期 行为 模型 通过 对 客户 的 交易 行为 特征 和 还 款 
行为 特征 进行 分 析 ， 考 察 客户 在 长 期 内 发 生 逾 期 行为 的 可 能 性 ， 但 对 短期 (如 1 个 月 ) 内 的 
逾期 行为 预测 能 力 很 弱 。 换 句 话说 ， 逾 期 行为 模型 是 对 客户 资质 进行 认定 的 模型 ， 资 质 较 
差 的 客户 是 逾期 客户 管理 的 工作 重点 。 该 模型 的 预测 变量 主要 包括 客户 的 还 款 行为 、 消 费 
行为 、 信 用 卡 取现 行为 、 资 金 使 用 情况 、 欠 款 情况 等 方面 。 

(2) 账 龄 滚动 率 模型 。 

账 龄 滚动 率 模 型 是 逾期 催收 中 最 常用 的 计量 模型 ， 是 在 对 客户 逾期 账 龄 进行 确定 的 基 
础 上 ， 对 每 一 账 龄 的 客户 演变 到 下 一 账 龄 的 概率 进行 预测 的 模型 。 其 中 ， 逾 期 账 龄 是 指 客 
户 未 按 约 定时 间 还 款 的 违约 时 间 长 度 ， 通 常 以 天 数 来 界定 ， 如 图 3.11 所 示 。 客 户 的 逾期 账 
龄 越 高 ， 其 违约 风险 就 越 大 。 


3.11 逾期 账 龄 划分 示例 


该 模型 体系 中 通常 包含 M0-M1( 代 表 客 户 从 正常 客户 变 为 M1 客户 )、M1-M2( 代 表 客 户 
从 M1 客户 变 为 M2 客户 )、M2-M3( 代 表 客 户 从 M2 客户 变 为 M3 客户 )、M3-M4( 代 表 客 户 
从 M3 客户 变 为 M4 客户 ) 账 龄 滚动 率 模型 ， 通 常 以 逻辑 回归 模型 和 决策 树 等 开发 方法 建 
立 。 在 该 模型 中 对 客户 账 龄 的 划分 一 般 都 在 90 天 以 下 ， 因 为 一 旦 客户 逾期 天 数 在 90 天 以 
上 ， 客 户 归 还 欠 款 的 可 能 性 急剧 下 降 ， 此 时 商业 银行 的 主要 目标 是 采用 严厉 的 催收 方式 以 
尽 最 大 努力 挽回 损失 ， 无 须 再 考虑 制定 催收 策略 。 此 外 ， 在 使 用 上 述 模型 对 客户 进行 评分 
时 ，M0-M1 账 龄 滚动 率 模型 主要 用 于 对 客户 风险 进行 预警 和 监控 ;而 M1-M2、M2-M3、 
M3-M4 账 龄 滚动 率 模型 则 是 通过 客户 评分 来 区 分 不 同 客户 所 具有 的 风险 ， 进 而 对 具有 不 同 
和 逾期 风险 的 客户 采用 不 同 的 催收 策略 ， 以 最 有 效 的 催收 方式 实现 欠 款 的 回收 。 

在 账 龄 滚动 率 模型 中 ， 预 测 变量 包括 行为 信息 和 催收 信息 两 种 类 型 。 其 中 ， 行 为 信息 
包括 还 款 行为 、 消 费 行为 、 信 用 卡 取现 行为 、 额 度 使 用 情况 等 方面 ;催收 信息 则 包括 催收 
结果 、 和 请 期 次 数 、 催 收 后 还 款 行为 等 方面 。 在 低 账 龄 的 客户 模型 中 ， 行 为 信息 比重 较 大 ; 
而 在 中 高 账 龄 的 客户 模型 中 ， 则 为 催收 信息 比重 较 大 。 

账 龄 滚动 率 模型 通常 与 逾期 行为 模型 结合 使 用 。 二 者 的 结合 能 够 帮助 商业 银行 从 短期 
和 长 期 两 个 方面 来 识别 客户 风险 ， 并 准确 地 对 客户 做 出 评价 ， 从 而 做 出 更 具 针 对 性 和 效率 
的 催收 决策 。 

(3) 失 联 模型 。 

失 联 模型 是 基于 对 历史 数据 的 处 理 和 分 析 ， 提 前 预知 客户 未 来 发 生 失 联 可 能 性 的 模 


94 


大 数据 在 商业 银行 中 的 应 用 剧 第 5 齐 


型 。 客 户 失 联 的 原因 通常 有 很 多 ， 如 客户 提交 虚假 材料 、 恶 意 贷款 、 故 意 断 绝 与 银行 的 联 
系 、 客 户 信息 未 及 时 更 新 等 情形 都 有 可 能 造成 客户 失 联 。 因此 ， 商业 银行 单纯 依靠 其 所 掌 
握 的 内 部 信息 数据 将 使 模型 很 难 做 出 正确 的 决策 ， 需 要 引入 更 多 更 全 面 的 外 部 数据 来 提高 
模型 的 预测 能 力 。 失 联 模型 中 的 预测 变量 通常 包括 客户 还 款 行为 、 消 费 行为 、 贷 款 余额 情 
况 、 额 度 占用 情况 、 联 系 方式 变更 情况 、 历 史 催 收 结果 、 与 该 客户 的 联系 频率 和 时 间 等 商 
业 银 行 的 内 部 信息 ， 也 包括 客户 户籍 信息 、 教 育 经 历 、 工 作 单 位 情况 、 家 庭 情况 等 第 三 方 
信息 。 

失 联 模型 通常 与 逾期 行为 模型 结合 使 用 。 对 于 失 联 概率 较 高 且 逾 期 风险 较 高 的 客户 ， 
商业 银行 应 当 给 予 重视 ， 及 时 了 解 客户 的 实际 情况 ;， 一 旦 发 现 客户 失 联 ， 及 时 采取 相应 措 
施 对 客户 信息 进行 修复 ， 将 可 能 遭受 的 损失 降 到 最 低 。 

4) ”催收 策略 的 制定 

在 大 数据 背景 下 ， 商 业 银行 催收 策略 的 客户 细 分 是 基于 客户 特征 的 不 同 进行 的 。 商 业 
银行 通过 对 大 量 数据 进行 分 析 和 挖掘 ， 找 出 不 同类 型 逾期 客户 的 特征 ， 进 而 有 针对 性 地 制 
定 出 与 客户 风险 状况 相符 的 催收 策略 ， 如 图 3.12 所 示 。 


elt 


“ 失 联 : 实地 催收 :实地 催收 
“ 大 额 逾期 : 实地 和 期 : 落地 “全 而 地 他 收 、 全 
催收 催 司法 催收 司法 催收 、 核 销 
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高 的 
" 其 他 : 电话 催收 


“ 其 他 : 电话 催 
收 风 险 较 高 的 
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图 3.12 ”基于 客户 特征 细 分 的 催收 策略 

在 对 客户 的 风险 等 级 进行 划分 时 ， 通 常 有 以 下 两 种 方法 : 一 是 根据 客户 的 违约 概率 对 
其 进行 风险 评级 ， 即 客户 无 法 还 款 的 可 能 性 越 高 ， 其 风险 程度 就 越 高 ， 二 是 根据 客户 的 风 
险 余 额 对 客户 进行 风险 评级 ， 风 险 余额 是 客户 无 法 还 款 的 可 能 性 与 客户 尚未 偿付 金额 的 乘 
积 ， 即 客户 的 风险 余额 越 大 ， 其 风险 等 级 就 越 高 。 

在 催收 策略 的 制定 过 程 中 ， 需 要 数据 挖掘 技术 和 催收 系统 的 支持 。 大 数据 的 应 用 不 仅 
使 商业 银行 对 其 客户 特征 的 刻画 更 为 精准 ， 而 且 能 够 帮助 商业 银行 有 效 把 握 不 同 客户 对 不 
同 催收 手段 的 反应 ， 从 而 做 出 最 优 的 催收 决策 ， 提 升 催收 工作 的 效果 。 例 如 ， 商 业 银行 通 
过 电信 运营 商 的 数据 发 现 某 逾期 客户 的 电信 账户 只 有 在 工作 日 的 晚间 和 周末 才 有 通话 或 上 
网 记录 ， 那 么 商业 银行 在 对 其 进行 电话 催收 时 要 选 在 上 述 时 间 段 内 进行 。 


3.4.3 反 欺 诈 
1. 商业 银行 所 面临 的 欺诈 行为 


这 里 所 指 商业 银行 面临 的 欺诈 行为 通常 是 本 身 带 有 恶意 的 目的 、 到 期 无 还 款 意愿 或 虚 
构 偿还 能 力 的 借款 行为 。 由 信息 的 不 对 称 所 造成 的 欺诈 行为 的 存在 无 疑 会 给 商业 银行 的 经 
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营造 成 损失 。 

随 着 信息 技术 的 不 断 发 展 ， 商 业 银行 贷款 业务 中 所 面临 的 欺诈 风险 越 来 越 高 ， 主 要 表 
现 为 以 下 两 个 方面 的 原因 一 是 在 当前 普遍 采用 的 非 现场 远程 授信 模式 下 ， 制 造 虚 翁 申请 
进而 骗取 贷款 的 成 本 极 低 。 二 是 我 国 的 信用 体系 目前 还 不 够 完善 ， 客 户 的 违约 行为 并 不 会 
对 其 日 后 生活 造成 重大 影响 ， 而 以 法 律 手段 惩治 违约 行为 的 成 本 又 过 高 ， 进 而 导致 客户 韦 
约 的 低 成 本 。 

根据 坎 诈 行为 的 发 生 阶段 的 不 同 ， 可 以 将 坎 诈 行为 分 为 申请 欺诈 和 交易 欺诈 两 种 类 
型 。 其 中 申请 炊 诈 是 发 生 在 贷 前 申请 环节 中 的 炊 诈 行为 ， 包 括 客户 提交 虚假 的 资质 证 明 材 
料 、 提 交 虚假 的 申请 信息 和 冒充 他 人 身份 申请 贷款 3 种 具体 类 型 。 而 交易 炊 诈 是 发 生 在 贷 
后 阶段 中 的 炊 诈 行为 ， 包 括 虚假 交易 、 账 户 接管 和 挪用 资金 3 种 具体 类 型 。 

2. 申请 欺诈 的 防范 

1) 营销 环节 

在 有 营销 人 员 参 与 的 贷款 业务 申请 中 ， 为 了 防范 欺诈 行为 的 出 现 ， 营 销 人 员 应 当 在 与 
客户 的 直接 接触 中 通过 与 客户 进行 交流 和 沟通 以 及 实地 走访 ， 对 客户 的 贷款 意愿 和 申请 次 
料 的 真实 性 进行 核实 。 对 于 没有 营销 人 员 参 与 的 营销 模式 下 所 发 生 的 贷款 业务 申请 (例如 通 
过 网 页 或 移动 网 手机 客户 端 所 发 起 的 贷款 申请 )， 对 其 进行 申请 欺诈 行为 的 防范 主要 体现 在 
审批 环节 。 

2) 审批 环节 

在 审批 环节 中 的 申请 欺诈 防范 主要 体现 在 以 下 3 个 方面 。 

(D 对 客户 提交 的 资质 证 明 资 料 的 真实 性 进行 核实 。 这 么 做 的 目的 在 于 确保 客户 符合 
商业 银行 所 要 求 的 授信 标准 ， 确 保 相关 信息 的 真实 、 完 整 ， 方 便 在 贷 后 环节 与 客户 的 联系 
和 互动 。 

(2) 对 客户 提交 的 申请 信息 的 真实 性 进行 核实 。 这 么 做 的 目的 在 于 保证 客户 的 基本 申 
请 信息 和 附属 申请 信息 的 真实 、 可 靠 。 

(3) 对 客户 借款 人 身份 的 真实 性 进行 核实 。 这 么 做 的 目的 在 于 防范 申请 人 冒 用 他 人 身 
份 骗取 贷款 的 风险 。 

商业 银行 的 上 述 核实 过 程 均 属于 信息 校 验 ， 通 常 包括 3 个 层次 :一 是 客户 申请 信息 的 
罗 辑 校 验 ， 二 是 客户 申请 信息 与 商业 银行 内 部 信息 间 的 逻辑 校 验 ， 三 是 客户 申请 信息 与 外 
部 信息 的 对 比 校 验 。 其 中 利用 外 部 信息 进行 对 比 校 验 离 不 开 大 数据 的 支持 ， 在 大 数据 技术 
的 帮助 下 ， 商 业 银行 所 获得 的 外 部 信息 不 仅 可 以 用 以 与 客户 的 申请 信息 进行 交叉 比 对 核实 
申请 信息 的 真实 性 ， 而 且 还 为 客户 的 信息 资料 提供 了 有 效 的 补充 ， 并 为 商业 银行 提供 了 更 
多 接触 客户 的 方式 。 

3) ” 贷 后 管理 环节 

虽然 申请 欺诈 发 生 于 贷款 申请 环节 ， 但 对 申请 欺诈 的 防 控 在 贷 后 管理 环节 仍 需要 进 
行 。 这 是 因为 依靠 贷 前 的 申请 和 审批 环节 的 审查 并 不 能 实现 欺诈 行为 的 完全 排除 。 在 贷 后 
管理 环节 对 申请 欺诈 的 防 控 主要 有 以 下 两 种 方式 。 

(1) 观察 客户 的 违约 情况 。 一 些 客户 的 违约 行为 通常 可 以 反映 出 其 属于 申请 欺诈 ， 这 
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些 行 为 特征 包括 但 不 限于 : 早期 违约 、 连 续 多 期 未 偿还 欠 款 、 联 系 方式 在 获得 贷款 后 的 短 
时 间 内 即 失 效 等 。 

(2) 信息 的 关联 排查 。 通 过 对 客户 数据 进行 关联 排查 ， 找 出 相关 数据 特征 与 已 发 现 的 
申请 欺诈 数据 特征 相 匹配 的 客户 ， 对 这 些 客户 进行 补充 调查 以 核实 其 申请 资料 和 身份 的 真 
实 性 。 

3. 交易 欺诈 的 防范 

1) ”放款 环节 

放款 环节 是 防范 交易 欺诈 行为 中 的 账户 接管 和 资金 挪用 的 重要 环节 。 在 向 客户 进行 放 
款 时 ， 商 业 银 行 通常 会 对 收 款 账户 的 户主 与 该 客户 的 身份 进行 比 对 核查 ， 以 防止 资金 被 他 
人 人 使用。 此外， 商业 银行 通常 还 会 对 客户 的 贷款 账户 采取 定向 支付 的 资金 划 转 方式 ， 以 防 
范 其 所 贷 出 的 资金 被 挪 为 他 用 。 

2) ”交易 环节 

在 交易 环节 防范 交易 欺诈 通常 仅 存在 于 商业 银行 向 个 人 客户 所 提供 的 循环 授信 业务 之 
中 ， 以 信用 卡 产 品 最 为 典型 。 在 商业 银行 所 提供 的 上 述 个 人 信贷 产品 中 ， 客 户 随时 使 用 额 
度 的 过 程 就 是 交易 的 过 程 。 通 过 对 客户 的 交易 过 程 进行 实时 或 准 实时 的 监控 管理 ， 商 业 银 
行 能 够 对 客户 的 行为 进行 及 时 的 观察 和 有 效 识别 ， 进 而 对 疑似 交易 欺诈 的 行为 进行 预警 。 

3) ”还 款 环节 

即便 客户 在 当前 正常 还 款 ， 也 不 能 排除 其 存在 交易 欺诈 的 可 能 。 有 的 借款 人 为 躲避 商 
业 银行 对 其 贷款 行为 的 关注 和 怀疑 ， 会 故意 正常 还 款 ， 进 而 导致 商业 银行 无 法 对 该 借款 人 
的 真实 贷款 用 途 和 资质 水 平 做 出 正确 的 判断 。 因 此 ， 在 贷 后 还 款 环 节 ， 仍 要 对 客户 账户 内 
的 资金 流向 进行 监控 ， 进 而 对 交易 欺诈 行为 进行 有 效 防范 。 

4. 欺诈 行为 识别 模型 

1) ”申请 欺诈 模型 

申请 欺诈 模型 是 通过 对 客户 的 相关 资料 信息 进行 评分 ， 从 而 对 客户 发 生 欺诈 行为 的 可 
能 性 进行 判断 的 。 商 业 银行 能 够 利用 其 获取 的 客户 申请 信息 、 央 行 征 信 信息 以 及 第 三 方 所 
提供 的 相关 客户 信息 ， 对 客户 的 欺诈 风险 进行 评估 。 

具体 来 讲 ， 该 模型 中 的 预测 变量 通常 包括 以 下 内 容 : 客户 的 工作 单位 是 否 在 征 信 单位 
列表 中 、 客 户 的 家 庭 住址 和 工作 地 址 是 否 在 征 信 的 列表 中 、 申 请 人 是 否 曾 发 生 过 欺诈 行 
为 、 同 一 Cookie 或 相近 的 人 P 地 址 是 否 在 短 时 间 内 多 次 发 出 申请 请 求 、 发 出 申请 的 Cookie 
和 了 IP 地 址 是 否 是 该 客户 经 常 使 用 的 、 客 户 是 否 有 活跃 的 互联 网 行为 、 客 户 在 电 商 平台 和 电 
信 运 营 商 等 第 三 方 处 所 留 下 的 相关 有 用 信息 等 。 

基于 大 数据 的 运用 ， 商 业 银 行 可 以 在 客户 进行 线 上 贷款 申请 时 ， 就 对 客户 的 相关 信息 
进行 采集 ， 进 而 提高 模型 的 准确 性 。 例 如 ， 收 集 客 户 申 请 贷款 时 所 处 的 地 理 位 置 ， 将 之 与 
其 家 庭 地 址 、 工 作 地 址 进行 对 比 ; 收集 客户 在 填写 申请 时 的 修改 内 容 、 修 改 次 数 、 提 交 次 
数 等 行为 信息 ， 将 之 作为 申请 欺诈 模型 的 预测 变量 。 此 外 ， 大 数据 还 使 商业 银行 的 申请 欺 
诈 模 型 和 应 对 策略 的 信息 考察 范围 得 到 了 扩大 ， 同 样 有 助 于 提高 模型 预测 和 策略 制定 的 准 
确 性 。 
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对 于 得 分 低 的 客户 ， 因 其 存在 很 大 的 欺诈 风险 ， 商 业 银 行 会 直接 拒绝 该 客户 的 贷款 申 
请 ; 对 于 得 分 较 低 的 客户 ， 商 业 银 行 则 会 安排 专业 审批 人 员 对 客户 进行 二 次 审查 ， 而 对 于 
模型 得 分 较 高 的 客户 ， 因 其 风险 水 平 较 低 ， 商 业 银行 可 以 通过 随机 抽样 的 方法 抽取 其 中 部 
分 客户 进行 风险 排查 。 

2) ”交易 欺诈 模型 

交易 欺诈 模型 所 衡量 的 是 客户 在 交易 环节 发 生 欺 诈 行 为 的 可 能 性 。 鉴 于 只 有 循环 授信 
产品 存在 交易 环节 ， 且 信用 卡 是 循环 授信 产品 中 最 为 主要 的 类 型 ， 因 而 这 里 的 交易 欺诈 行 
为 ， 是 指 不 法 分 子 通过 盗 卡 、 伪 卡 等 方式 盗 取 客户 账户 资金 的 行为 ( 即 非法 账户 接管 ) 以 及 
虚假 交易 行为 。 
因为 交易 欺诈 行为 具有 多 样 性 和 隐蔽 性 的 特点 ， 所 以 交易 欺诈 模型 需要 有 非常 高 的 精 
准 性 。 由 于 神经 网 络 具 有 很 强 的 自学 习 能 力 ， 能 够 适应 欺诈 行为 多 样 且 复杂 的 特点 ， 因 而 
通常 商业 银行 会 利用 神经 网 络 来 开发 交易 欺诈 模型 。 基 于 交易 欺诈 模型 的 利用 ， 商 业 银 行 
可 以 通过 客户 的 历史 交易 行为 刻画 客户 的 行为 特征 ， 进 而 将 该 客户 本 次 被 标识 的 异常 交易 
与 其 历史 交易 行为 特征 进行 对 比 ， 若 二 者 间 存 在 较 大 的 差异 ， 则 说 明 发 生 交易 坎 诈 行为 的 
可 能 性 较 大 。 

该 模型 的 预测 变量 包括 但 不 限于 以 下 内 容 : 本 次 交易 金额 、 本 次 交易 时 间 、 本 次 交易 
商户 、 本 次 交易 地 点 、 本 次 交易 币 种 、 过 去 一 定时 间 内 的 交易 次 数 、 过 去 一 定 交易 次 数 内 
输 错 密码 的 次 数 、 过 去 一 定 交易 次 数 内 交易 失败 的 次 数 、 本 次 交易 瑟 地址、 浏览 和 交易 的 
网 站 信息 等 。 

由 于 交易 欺诈 模型 通常 要 涉及 大 量 的 历史 交易 数据 和 相关 信息 并 对 时 效 性 有 和 较 高 的 要 
求 ， 因 此 商业 银行 利用 大 数据 技术 能 够 很 好 地 对 系统 的 大 量 运 算 给 予 支持 。 此 外 ， 基 于 对 
大 数据 的 运用 ， 商 业 银行 能 够 实现 交易 欺诈 模型 中 预测 变量 的 及 时 获取 和 调整 补充 ， 进 而 
使 模型 的 时 效 性 得 到 有 效 的 保证 。 


5. 大 数据 下 的 反 欺 诈 


1) ”用 互联 网 信息 描述 客户 特征 

伴随 着 移动 互联 网 的 普及 和 发 展 ， 个 人 的 行为 信息 越 来 越 多 地 被 记录 于 互联 网 之 中 。 
商业 银行 通过 利用 从 多 种 合法 渠道 获取 的 客户 在 互联 网 中 的 相关 数据 信息 (如 浏览 行为 、 交 
易 行为 、 购 买 记录 、 搜 索 记 录 、 社 交 活 动 等 )， 可 以 对 该 客户 的 行为 偏好 、 社 交 范 围 、 工 作 
状况 、 文 化 程度 、 偿 付 能 力 形成 一 定 准确 的 认 知 ， 不 再 完全 依赖 于 该 客户 的 历史 信贷 记录 
和 有 限 的 传统 审批 资料 。 

2)” 线 上 信息 与 线 下 信息 相 结 合 

虽然 互联 网 信息 可 以 对 客户 特征 进行 描述 ， 但 单纯 依赖 客户 的 线 上 信息 并 不 能 对 该 客 
户 形成 全 面 的 认 知 。 因 此 ， 商 业 银行 只 有 将 内 部 与 外 部 、 线 上 与 线 下 的 多 维度 信息 进行 综 
合 使 用 才能 对 欺诈 行为 进行 有 效 的 管控 。 

3) ”基于 网 络 技 术 的 非 现场 审查 

贷款 申请 方式 的 创新 使 商业 银行 的 贷款 业务 越 来 越 多 地 以 非 现场 的 方式 开展 ， 但 移动 
互联 网 技术 的 发 展 为 商业 银行 进行 远程 审查 提供 了 更 多 的 手段 。 在 非 现场 的 贷款 业务 申请 
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过 程 中 ， 商 业 银行 通常 会 要 求 申 请 人 通过 手机 等 移动 智能 设备 拍摄 包含 指定 动作 的 视频 或 
照片 ， 用 来 对 该 申请 人 的 身份 、 工 作 地 点 等 相关 信息 进行 真实 性 审查 。 


3.4.4 反 洗 钱 


反 洗 钱 是 政府 动用 立法 、 司 法 力量 ， 调 动 有 关 的 组 织 和 商业 机 构 对 可 能 的 洗钱 活动 巴 
以 识别 ， 对 有 关 款 项 予以 处 置 ， 对 相关 机 构 和 人 士 予 以 惩罚 ， 从 而 达到 阻止 犯罪 活动 目的 
的 一 项 系统 工程 。 洗 钱 行为 会 给 社会 造成 诸多 不 良 影响 和 危害 。Q 洗 钱 行为 会 掩盖 非法 所 
得 、 促 成 资本 外 逃 ， 进 而 使 贪 腐 资 金 转移 境外 ， 导 致 社会 财富 外 流 ; @@ 不 法 分 子 会 利用 洗 
钱 行为 为 违法 犯罪 集团 提供 资金 ， 因 而 洗钱 行为 会 助长 违法 犯罪 、 破 坏 社会 的 和 谐 稳定 
图 洗钱 行为 会 动摇 社会 信用 ， 危 害 国家 金融 安全 。 因 此 ， 反 洗钱 工作 在 稳定 市 场 经 济 秩 
序 、 阻 止 非法 资金 外 流 、 维 护 社会 稳定 中 发 挥 着 重要 作用 。 

商业 银行 是 反 洗钱 职责 的 主要 承担 者 。 在 全 球 经 济 一 体 化 和 信息 化 不 断 加 快 的 背景 
下 ， 洗 钱 犯罪 的 特征 也 呈现 出 隐蔽 、 快 速 的 新 特点 。 在 大 数据 时 代 ， 随 着 大 数据 技术 的 日 
趋 成 熟 和 完善 ， 商 业 银 行 也 开始 将 大 数据 技术 应 用 到 防范 和 控制 洗钱 活动 、 提 升 反 洗钱 工 
作 的 效率 中 来 ， 通 过 构建 统一 的 反 洗 钱 工作 系统 ， 对 商业 银行 所 拥有 的 内 部 海量 数据 进行 
充分 整合 和 深入 挖掘 ， 进 而 使 反 洗 钱 工作 的 时 效 性 和 准确 性 得 到 提高 。 


1. 大 数据 在 反 洗钱 工作 中 的 优势 


1) 发挥 商业 银行 的 数据 优势 

在 商业 银行 开展 业务 的 过 程 中 ， 每 天 都 会 产生 海量 数据 。 这 些 数据 包括 商业 银行 交易 
系统 中 所 产生 的 海量 交易 信息 、 商 业 银行 业务 处 理 流 程 中 用 于 作业 和 授权 的 影像 资料 等 半 
结构 化 数据 以 及 客户 的 投诉 和 评价 等 交互 信息 。 因 此 ， 商 业 银 行 在 对 大 数据 进行 应 用 方面 
具备 天 然 的 优势 。 商 业 银 行 通过 充分 利用 大 数据 技术 与 聚 类 、 神 经 网 络 、 决 策 树 等 智能 算 
法 ， 能 够 对 其 所 掌握 的 数据 进行 有 效 的 分 析 和 挖掘 ， 进 而 提升 其 自身 在 反 洗 钱 工 作 中 的 时 
效 性 和 准确 度 。 

2) ”提高 反 洗钱 调查 的 时 效 性 

商业 银行 在 进行 反 洗钱 调查 时 ， 主 要 依据 《金融 机 构 大 额 交易 和 可 疑 交 易 报告 管理 办 
法 》 对 客户 身份 的 真实 性 进行 识别 。 只 要 相关 交易 的 数据 特征 符合 可 疑 交易 的 给 定 标准 ， 
商业 银行 就 会 将 该 交易 数据 报 送 至 反 洗钱 监管 机 构 。 商 业 银 行 在 判别 客户 交易 是 否 具有 可 
疑 性 时 ， 只 有 在 客户 身份 真实 性 识别 的 准确 度 得 到 提高 的 前 提 下 ， 才 能 实现 其 可 疑 性 审查 
质量 的 提高 。 在 数据 的 应 用 下 ， 商 业 银 行 在 对 客户 身份 的 真实 性 进行 审查 的 过 程 中 ， 可 以 
将 可 疑 交 易 数 据 与 客户 所 在 地 域 、 工 作 状 况 、 受 教育 程度 、 收 入 水 平等 个 人 身份 特征 相 联 
系 ， 进 而 减少 可 疑 性 审查 出 现 失 真 和 误 报 的 可 能 性 ， 提 高 反 洗钱 调查 的 实效 性 。 

3) ”提升 反 洗钱 工作 的 效率 

商业 银行 内 部 有 许多 信息 系统 ， 这 些 信息 系统 是 分 散 且 异 构 的 ， 各 个 信息 系统 的 技术 
指标 也 不 尽 相 同 ， 因 而 导致 每 个 信息 系统 都 是 封闭 的 信息 孤岛 。 正 因 如 此 ， 基 于 上 述 关 系 
型 数据 库 和 传统 数据 挖掘 技术 所 构建 出 的 反 洗 钱 工 作 系统 ， 会 面临 大 量 数据 的 格式 不 统 
一 、 无 法 存储 、 难 以 处 理 等 技术 障碍 。 由 于 大 数据 技术 能 够 对 非 结构 化 数据 进行 处 理 并 多 
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许 数据 存在 不 一 致 ， 因 而 利用 大 数据 技术 可 以 解决 上 述 传 统 反 洗钱 工作 系统 中 所 存在 的 难 
题 ， 缩 短 系统 的 响应 时 间 ， 进 而 使 商业 银行 在 反 洗 钱 工作 中 的 效率 得 到 提升 。 


2. 商业 银行 基于 大 数据 的 反 洗 钱 工 作 系 统 


1)” 反 洗钱 工作 系统 的 工作 目标 

反 洗 钱 工作 系统 的 工作 目标 主要 包括 以 下 4 个 方面 : 一 是 构建 基于 大 数据 的 数据 仓 
库 ; 二 是 对 数据 进行 加 载 、 处 理 、 清 洗 、 转 换 ， 三 是 配置 反 洗钱 业务 规则 ;， 四 是 对 可 疑 数 
据 进 行 展 示 。 

2)” 反 洗钱 工作 系统 的 逻辑 分 层 

(1) 源 数据 : 商业 银行 内 部 各 个 系统 中 的 数据 。 

(2) 数据 存储 : 在 初始 状态 下 与 源 数据 层 的 表 结构 一 致 ， 但 之 后 不 再 随 原 数据 层 表 结 
构 的 变化 而 变化 。 

(3) 数据 汇聚 : 完成 对 客户 、 账 户 和 交易 数据 中 的 相关 主题 数据 的 采集 和 整理 。 

(4) 数据 分 析 : 根据 预先 设 定 的 可 疑 规 则 对 数据 汇聚 层 的 数据 进行 计算 分 析 ， 从 中 找 
出 可 疑 交易 并 生成 可 疑 报表 。 

(5) 信息 管理 : 对 数据 分 析 层 所 得 出 的 预警 信息 和 报表 信息 进行 管理 。 其 中 具体 包 
括 : 用 户 管理 、 规 则 定义 、 权 限 管理 、 日 志 管 理 、 报 表 管理 、 报 送 管理 等 相关 管理 活动 。 

(6) 决策 分 析 : 商业 银行 相关 工作 人 员 对 预警 信息 进行 处 理 以 对 可 疑 交 易 进 行 确认 ， 
进而 将 所 筛选 出 的 可 疑 数据 报 送 相关 监管 部 门 。 

3)” 反 洗钱 工作 系统 的 系统 架构 

反 洗钱 工作 系统 的 系统 架构 如 图 3.13 所 示 。 


| 


反 洗钱 服务 端 


图 3.13” 反 洗钱 工作 系统 的 系统 架构 
(1) 源 系 统 : 即 属于 源 数据 层 的 商业 银行 内 部 的 各 个 数据 系统 。 
(2) 数据 传输 平台 : 该 平台 的 功能 在 于 将 源 系统 中 的 数据 传输 至 指定 位 置 。 
(3) 反 洗 钱 服 务 端 : 服务 端 由 批量 服务 和 联机 服务 两 部 分 组 成 。 其 中 ， 批 量 服务 是 指 
系统 自动 完成 对 可 疑 数据 提取 的 活动 ， 即 从 源 系统 获取 源 数 据 ， 并 进行 清洗 和 装载 ， 而 联 
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机 服务 则 是 指 系统 用 户 进入 系统 完成 系统 操作 的 活动 。 具 体 来 讲 ， 批 量 服务 在 源 数据 的 基 
础 上 根据 预 设 的 各 项 指标 计算 账户 和 客户 的 指标 值 ， 在 各 项 指标 值 的 基础 上 根据 预 设 的 可 
疑 规则 生成 可 疑 报 送 数据 ， 同 时 进行 报表 生产 ， 属 于 系统 逻辑 分 层 中 的 数据 存储 层 、 数 据 
汇聚 层 、 数 据 计算 层 。 而 联机 服务 则 主要 包括 系统 管理 、 参 数 设 定 、 预 警 / 报告 处 理 、 统 
计 报 表 ， 属 于 系统 逻辑 分 层 中 的 信息 管理 层 。 


(OO 了 ES 运营 优化 


随 着 中 国 经 济 进 入 “新 常态 ”以 及 互联 网 金融 的 快速 发 展 ， 商 业 银 行 在 当前 面临 着 巨 
大 的 冲击 和 挑战 。 从 发 达 国 家 银行 业 的 发 展 经 验 来 看 ， 利 用 大 数据 挖掘 能 够 大 幅 提高 商业 
银行 的 经 营 水 平 。 

从 运营 角度 来 看 ， 大 数据 技术 为 商业 银行 透彻 地 了 解 市 场 创造 了 可 能 。 商 业 银行 可 以 
通过 对 海量 客户 行为 数据 进行 分 析 ， 了 解 未 来 市 场 的 发 展 方向 ， 进 而 做 出 有 针对 性 的 战略 
安排 。 


3.5.1 市 场 和 渠道 分 析 优化 

1. 商业 银行 的 市 场 渠道 

1) 商业 银行 市 场 渠道 的 种 类 

商业 银行 有 柜台 网 点 和 电子 银行 两 种 市 场 渠道 。 其 中 ， 电 子 银行 是 指 商业 银行 等 银行 
业 金 融 机 构 利 用 面向 社会 公众 开放 的 通信 通道 或 开放 型 公众 网 络 ， 以 及 银行 为 特定 自助 服 
务 设施 或 客户 建立 的 专用 网 络 ， 向 客户 提供 的 银行 服务 。 商 业 银行 所 开发 的 自助 银行 、 网 
上 银行 、 电 话 银 行 、 手 机 银行 、 微 信和 银行 等 都 属于 商业 银行 的 电子 渠道 。 

柜台 渠道 是 商业 银行 最 传统 的 市 场 渠道 ， 能 够 使 商业 银行 工作 人 员 与 客户 面对面 地 进 
行 接触 和 沟通 ， 业 务 范围 也 最 为 广泛 。 截 至 2015 年 年 末 ， 我 国 商业 银行 的 业务 网 点 已 有 
22 万 家 ， 并 分 布 在 世界 各 地 。 
自助 银行 主要 表现 为 ATM 集群 。ATM(Automatic Teller Machine) 也 称 自动 柜员 机 ， 是 
在 无 人 直接 干预 管理 的 情况 下 ， 能 够 向 客户 提供 查询 、 存 取款 、 转 账 汇 款 等 金融 服务 的 银 
行 自助 设备 。 作 为 对 柜台 渠道 的 补充 ， 自 助 银行 使 商业 银行 的 经 营 效率 得 到 提高 、 业 务必 
盖 面 得 到 扩大 。 

网 上 银行 是 指 商业 银行 依托 互联 网 向 客户 提供 相关 金融 服务 的 方式 。 客 户 能 够 随时 随 
地 访问 商业 银行 的 网 页 ， 并 根据 网 页 上 的 导航 和 操作 指引 办 理 其 所 需要 的 业务 。 
电话 银行 是 指 商业 银行 以 语音 通信 的 方式 向 客户 提供 相关 金融 服务 的 方式 。 客 户 可 以 
随时 随地 通过 商业 银行 所 提供 的 自助 语音 服务 和 人 工 服 务 办 理 其 所 需要 的 日 常 业务 。 

手机 银行 是 指 商业 银行 以 安装 在 客户 手机 内 的 客户 端 软件 为 媒介 ， 为 客户 提供 相应 金 
融 服 务 的 方式 。 手 机 银行 与 上 述 商 业 银行 的 市 场 渠 道 相 比 具有 更 高 的 便捷 性 。 

微 信和 银行 、 微 博 银行 等 创新 渠道 是 商业 银行 以 社交 软件 为 媒介 为 客户 提供 相应 的 金融 
服务 的 创新 方式 。 其 中 ， 微 信和 银行 对 商业 银行 的 市 场 拓 展 作用 最 为 明显 。 在 这 一 创新 的 市 
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场 渠 道中 ， 客 户 不 仅 可 以 办 理 所 有 的 日 常 业 务 ， 还 能 够 及 时 且 直 观 地 接收 到 商业 银行 的 活 
动 推广 。 

2) ”商业 银行 市 场 渠 道 的 新 特点 

在 大 数据 的 背景 下 ， 商 业 银 行 的 市 场 渠道 在 发 展 中 也 呈现 出 新 特点 。 

(1) 运营 模式 互联 网 化 。 随 着 移动 互联 网 的 快速 发 展 ， 越 来 越 多 的 人 活跃 在 网 络 世界 
中 。 作 为 以 客户 为 服务 导向 的 商业 银行 也 开始 重视 对 电子 渠道 的 发 展 ， 尤 其 是 对 手机 银 
行 、 直 销 银行 等 创新 渠道 的 利用 。 

(2) 客户 定位 精准 化 。 由 于 商业 银行 通过 不 同 的 市 场 渠 道 所 接触 到 的 客户 群 存在 一 定 
的 不 同 ， 且 越 来 越 多 的 客户 信息 能 够 被 采集 和 利用 ， 因 此 商业 银行 借助 大 数据 技术 在 对 不 
同 的 市 场 渠道 进行 利用 时 ， 对 各 个 渠道 客户 特征 的 描述 也 日 益 精准 ， 对 市 场 的 敏感 性 也 不 
断 增 强 。 

(3) 市 场 战略 差异 化 。 在 对 各 个 渠道 的 客户 群 做 出 精准 定位 后 ， 商 业 银 行 针 对 各 渠道 
客户 群 的 不 同 特征 制定 出 不 同 的 市 场 战略 。 客 户 定位 越 精准 ， 市 场 战略 的 差异 化 越 大 。 

2. 市 场 渠 道 的 运营 质量 

对 不 同市 场 渠道 的 运营 质量 进行 监控 ， 可 以 帮助 商业 银行 筛选 出 发 展 前 景 较 好 的 渠 
道 ， 以 对 该 渠道 进行 进一步 的 调整 和 优化 ， 进 而 增强 商业 银行 的 市 场 竞争 力 ， 还 可 以 帮助 
商业 银行 分 析出 各 个 渠道 适宜 推广 的 产品 和 服务 ， 进 而 实现 产品 和 服务 推广 策略 的 优化 。 

在 大 数据 的 背景 下 ， 对 渠道 运营 质量 进行 考量 已 不 再 是 一 件 难事 。 对 渠道 运营 质量 的 
考量 可 以 从 成 本 、 收 益 \ 客 户 的 感知 和 偏好 3 个 方面 进行 。 

1) 成 本 方面 

市 场 渠道 的 运营 成 本 通常 由 商业 银行 在 该 渠道 开发 和 使 用 的 过 程 中 所 投入 的 全 部 价值 
量 构成 。 一 般 包 括 商业 银行 所 投入 的 人 力 成 本 、 营 销 成 本 、IT 运营 成 本 和 开发 成 本 。 其 
中 ，IT 运营 成 本 包括 硬件 成 本 、 软 件 成 本 、 维 护 成 本 和 IT 设备 折旧 等 成 本 ， 开 发 成 本 则 
包括 产品 的 设计 和 开发 、 业 务 开发 、 软 件 开发 、 系 统 开发 等 相关 活动 的 成 本 。 电 子 渠 道 与 
柜台 渠道 相 比 ， 在 降低 成 本 方面 的 表现 更 为 突出 。 

2) ”收益 方面 

市 场 渠道 的 收益 通常 表现 为 商业 银行 利用 各 渠道 提供 金融 服务 所 实现 的 收入 ， 例 如 转 
账 收益 等 相关 收入 。 商 业 银 行 创新 的 市 场 渠 道 (如 微 信 银行 ) 与 其 传统 市 场 渠道 相 比 ， 还 具 
有 一 定 的 获 客 优势 ， 可 以 在 为 存量 客户 提供 服务 的 同时 吸引 更 多 的 新 用 户 加 入 ， 进 而 为 商 
业 银 行 带 来 更 多 的 收益 。 

3) ”客户 的 感知 和 偏好 

由 于 客户 的 反馈 是 直接 的 市 场 反应 ， 因 此 在 对 市 场 渠道 的 运营 质量 进行 考量 时 ， 还 需 
要 考虑 客户 在 各 渠道 中 的 感知 和 偏好 。 商 业 银 行 可 以 通过 分 析 客 户主 动 做 出 的 评价 反馈 以 
及 客户 在 该 渠道 中 发 生 的 行为 获取 客户 的 感知 和 偏好 。 


3. 市 场 渠道 运营 优化 
大 数据 在 商业 银行 市 场 渠道 运营 优化 中 的 作用 主要 表现 为 以 下 5 个 方面 。 
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1) ”构建 360 度 全 景 客户 信息 视图 

大 数据 具有 强大 的 信息 获取 、 集 成 和 分 析 的 能 力 。 因 此 ， 商 业 银 行将 其 内 部 的 客户 相 
关 数 据 与 外 部 第 三 方 所 拥有 的 信息 数据 相 结合 ， 利 用 大 数据 技术 可 以 对 客户 从 多 个 角度 进 
行 认 知 ， 进 而 构建 起 360 度 全 景 客 户 信息 视图 ， 以 帮助 商业 银行 根据 不 同 客户 的 不 同 需求 
对 其 市 场 渠道 进行 有 效 优化 。 

2) ”实现 精准 化 营销 和 精细 化 服务 

在 大 数据 的 背景 下 ， 商 业 银 行 可 以 根据 客户 的 身份 背景 、 行 为 特征 等 多 方面 信息 对 每 
一 位 客户 的 服务 需求 进行 预测 和 判断 ， 进 而 向 每 一 位 客户 进行 有 针对 性 的 营销 、 提 供 有 针 
对 性 的 服务 。 在 这 一 过 程 中 ， 商 业 银 行 市 场 渠 道 的 运营 效率 得 到 了 提升 。 

3) ”增强 客户 夭 性 

商业 银行 在 利用 大 数据 技术 对 客户 形成 准确 认 知 的 基础 上 ， 可 以 依据 客户 特征 的 不 同 
对 客户 进行 精准 营销 ， 进 而 使 客户 关系 得 以 深化 ， 使 客户 的 渠道 交易 活跃 度 以 及 产品 覆盖 
度 得 以 提高 。 

4) ”提升 客户 对 商业 银行 的 价值 贡献 

在 客户 黏 性 增强 的 基础 上 ， 客 户 无 疑 会 为 商业 银行 带 来 更 多 的 价值 贡献 ， 进 而 使 渠道 
收益 得 以 增长 ， 使 渠道 质量 得 到 有 效 的 提升 。 

5) ”发 现 新 的 市 场 需求 

基于 大 数据 的 利用 ， 商 业 银 行 可 以 及 时 地 捕捉 到 潜在 的 市 场 需求 ， 进 而 可 以 根据 该 需 
求 对 其 全 部 或 部 分 市 场 渠 道 的 业务 功能 进行 补充 和 完善 。 


3.5.2 ”产品 和 服务 优化 
1. 产品 策略 的 优化 


1) 产品 研发 个 性 化 

在 大 数据 背景 下 的 产品 研发 过 程 中 ， 商 业 银行 可 以 将 客户 行为 转化 为 信息 流 ， 在 对 各 
类 型 客户 的 身份 背景 、 行 为 偏好 等 进行 深入 了 解 的 基础 上 合理 预测 客户 需求 ， 进 而 根据 上 
述 大 数据 分 析 的 结果 有 针对 性 地 为 不 同 的 客户 群 制定 不 同 的 金融 产品 ， 从 而 为 客户 提供 最 
优 的 产品 体验 。 

2) “产品 设计 模块 化 

产品 设计 的 模块 化 是 指 商业 银行 根据 大 数据 分 析 的 结果 ， 设 计 出 多 种 不 同 的 定制 化 模 
块 并 构建 出 模块 化 的 产品 选择 体系 。 在 产品 设计 模块 化 的 基础 上 ， 商 业 银行 可 以 根据 不 同 
的 客户 需求 和 营销 场景 对 其 产品 和 服务 进行 个 性 化 搭配 ， 从 而 为 客户 提供 最 佳 的 金融 产品 
与 服务 的 组 合 。 

2. 价格 策略 的 优化 

1) “价格 策略 的 差异 化 

基于 对 大 数据 技术 的 利用 ， 商 业 银行 可 以 在 结合 自身 市 场 定 位 的 基础 上 ， 根 据 客户 层 
次 和 需求 的 不 同 为 客户 提供 差异 化 的 价格 策略 。 即 商业 银行 可 以 通过 利用 大 数据 技术 整合 
和 分 析 海 量 数据 对 市 场 和 客户 进行 有 效 细 分 ， 进 而 根据 不 同 的 客户 类 型 、 不 同 的 业务 类 
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型 、 不 同 的 行业 、 不 同 地 区 的 风险 程度 确定 不 同 的 业务 收费 标准 。 

2) ”价格 策略 的 动态 化 调整 

由 于 市 场 和 客户 需求 都 是 在 不 断 变化 的 ， 因 此 商业 银行 需要 根据 这 些 变化 来 调整 其 价 
格 策略 以 助 其 获得 有 利 的 市 场 竞争 地 位 。 商 业 银行 利用 大 数据 技术 可 以 对 金融 市 场 的 资金 
状况 以 及 其 他 投资 品 价格 的 实时 数据 进行 分 析 ， 进 而 对 未 来 利率 走势 做 出 预测 ， 以 便 对 
其 产品 和 服务 的 价格 做 出 及 时 的 调整 。 此 外 ， 基 于 对 大 数据 技术 的 应 用 ， 商 业 银 行 可 以 深 
入 了 解 不 同 客户 的 需求 及 价格 敏感 度 ， 进 而 对 其 价格 策略 进行 有 针对 性 的 调整 ， 在 赢得 新 
用 户 的 同时 对 存量 客户 进行 有 效 维护 。 

3. 客户 服务 的 效率 优化 


大 数据 背景 下 、 商 业 银行 客户 服务 的 效率 优化 主要 体现 在 商业 银行 向 其 客户 提供 的 个 
性 化 增值 服务 上 。 其 中 ， 个 性 化 增值 服务 主要 包括 个 性 化 的 产品 推荐 、 位 置 营销 、 电 子 渠 
道 的 全 景 体验 等 服务 。 

商业 银行 通过 利用 大 数据 技术 所 获取 的 信息 数据 ， 可 以 了 解 到 客户 密切 关注 或 频繁 访 
问 的 特定 事件 ， 进 而 结合 通过 分 析 客 户 购买 行为 所 得 出 的 全 方位 需求 预测 ， 及 时 地 向 客户 
提供 相应 的 服务 推荐 和 优惠 信息 。 在 这 一 增值 服务 提供 的 过 程 中 充分 地 实现 了 对 客户 的 尊 
重 ， 能 够 有 效 地 获得 客户 基于 其 价值 自我 实现 的 认同 。 从 中 可 以 看 出 ， 基 于 大 数据 技术 的 
客户 服务 与 传统 方式 相 比 ， 服 务 效 率 得 到 了 明显 的 提高 。 


3.5.3 网络 与 情 分 析 
1. 商业 银行 网 络 熏 情 的 类 型 


1) ”根据 发 展 过 程 划分 

根据 发 展 过 程 的 不 同 ， 商 业 银行 网 络 与 情 可 以 分 为 渐进 式 和 突 发 式 两 种 类 型 。 

(1) 渐进 式 网 络 与 情 。 是 指 发 展 过 程 较 慢 、 矛 盾 在 网 络 中 逐渐 积累 并 最 终 由 某 一 事件 
触发 的 与 情 。 例 如 ， 客 户 在 商业 银行 网 点 办 理 业务 排队 时 间 过 长 所 导致 的 与 情事 件 即 为 渐 
进 式 网 络 与 情 。 

(2) 突 发 式 网 络 与 情 。 是 指 发 生得 十 分 突然 ， 且 在 网 络 中 快速 传播 并 引起 公众 的 强烈 
反应 的 与 情 。 例 如 ， 商 业 银行 的 交易 系统 突然 发 生 故 障 使 客户 资金 无 法 及 时 到 账 所 引发 的 
与 论 事 件 即 为 突 发 式 网 络 与 情 。 

2) ”根据 成 因 不 同 划分 

根据 发 生成 因 的 不 同 ， 商 业 银 行 网 络 与 情 可 以 分 为 诽谤 型 、 误 解 型 和 情绪 型 。 

(1) 诽谤 型 网 络 和 与 情 。 是 指 不 法 分 子 为 谋取 不 正当 利益 所 进行 的 恶意 造谣 和 诽谤 。 例 
如 ， 在 网 络 上 发 布 不 实 消息 称 某 商 业 银行 ATM 吐 假 钞 所 引发 的 与 情事 件 。 

(2) 误解 型 网 络 与 情 。 是 指 客户 基于 其 对 商业 银行 相关 规章 制度 、 业 务 行为 的 重大 误 
解 ， 在 网 络 上 发 布 言 论 皇 击 商业 银行 所 引发 的 与 情事 件 。 例 如 ， 有 小 额 取款 需求 的 客户 认 
为 银行 工作 人 员 建 议 其 去 ATM 上 取款 是 歧视 行为 。 

(3) 情绪 型 网 络 与 情 。 是 指 客户 基于 对 商业 银行 在 为 其 提供 金融 服务 时 存在 的 疏忽 和 
丝 漏 的 不 满 ， 在 网 络 上 发 布 相关 言论 所 引发 的 与 情事 件 。 例 如 ， 客 户 因 在 柜台 办 理 业 务 时 
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所 耗费 的 时 间 过 长 所 产生 的 不 满 情绪 。 
2. 商业 银行 网 络 和 与 情 的 监控 系统 


商业 银行 可 以 利用 大 数据 技术 建立 起 网 络 和 与 情 监控 系统 ， 进 而 帮助 商业 银行 提高 其 网 
络 与 情 的 风险 管理 能 力 。 网 络 和 与 情 监控 系统 可 以 自动 搜集 和 分 析 潜 在 的 与 情 信息 ， 及 时 发 
现存 在 的 风险 因素 ， 进 而 对 风险 进行 有 效 的 预警 。 此 外 ， 网 络 和 与 情 监控 系统 还 可 以 帮助 商 
业 银 行 对 已 发 生 网 络 与 情事 件 的 发 展 态势 进行 监测 ， 并 对 与 情 控制 措施 的 实施 效果 进行 检 
验 。 因 此 ， 商 业 银行 的 舆情 监控 系统 通常 包括 以 下 4 个 模块 。 

1) 网络 与 情 的 信息 收集 模块 

通过 利用 大 数据 技术 在 网 页 、 论 坛 、 社 交 平 台 等 网 络 媒介 中 根据 事先 设 定 关键 词 对 网 
络 与 情 进行 收集 和 整理 ， 并 将 所 获取 的 网 络 与 情 传送 至 信息 处 理 服务 器 中 。 

2) “网络 与 情 的 信息 集成 和 分 析 模 块 

在 该 模块 中 ， 商 业 银行 所 获取 的 网 络 与 情 信息 将 被 进行 再 次 筛选 和 甄别 ， 进 而 实现 数 
据 噪声 的 有 效 剔 除 ， 此 外 还 将 根据 发 生 频率 的 不 同 对 筛选 后 的 与 情 信息 进行 分 类 和 初步 分 
析 。 

3) 网络 与 情 的 风险 评估 模块 

根据 对 各 网 络 与 情 所 表达 观点 的 倾向 性 进行 分 析 和 统计 ， 进 而 得 出 各 个 与 情 的 公众 关 
注 度 和 风险 程度 ， 并 对 舆情 的 发 展 趋势 做 出 初步 的 判断 。 

4) 网络 与 情 的 风险 报告 和 预警 模块 

该 模块 将 会 对 网 络 与 情 风险 评估 模块 所 得 出 的 结论 进行 进一步 的 分 析 和 总 结 ， 从 与 情 
的 性 质 、 和 危害 程度 、 影 响 范 围 、 可 控 程 度 等 角度 对 该 与 情 所 具有 的 风险 进行 量化 ， 并 根据 
量化 结果 对 超出 预警 值 的 与 情 进行 预警 。 如 图 3.14 所 示 为 网 络 与 情 监控 系统 。 


呈 汪汪 信息 的 自动 搜集 


信息 的 饰 选 和 分 类 


风险 评估 国 罗 


.信息 的 量化 


模块 


图 3.14 网络 与 情 监控 系统 
3. 大 数据 技术 在 商业 银行 网 络 与 情 分 析 中 的 作用 


1) “客户 洞察 
商业 银行 在 利用 大 数据 技术 对 网 络 人 与 情 进行 分 析 时 ， 可 以 基于 其 多 方 获取 的 网 络 信息 
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对 客户 的 特征 、 需 求 、 搜 索 关 键 词 等 多 种 客户 网 络 行为 特征 进行 全 天 候 的 实时 监测 ， 从 而 
实现 准确 的 客户 洞察 。 在 准确 洞察 客户 的 基础 上 ， 商 业 银 行 能 够 进行 有 效 的 客户 关系 管理 
并 做 出 准确 的 营销 决策 。 

2) ”舆论 导向 

基于 对 大 数据 技术 的 应 用 ， 商 业 银 行 在 对 网 络 与 情 进行 监控 时 能 够 及 时 地 获取 该 话题 
的 舆论 导向 ， 使 其 对 网 络 舆 情 的 把 握 和 控制 能 力 得 到 有 效 的 提高 。 对 于 正面 的 网 络 与 情 ， 
商业 银行 可 以 基于 对 舆论 导向 的 把 握 在 合适 的 时 机 对 自身 进行 恰当 的 宣传 ， 对 于 负面 的 网 
络 与 情 ， 商 业 银 行 可 以 基于 其 对 与 论 导 向 的 控制 能 力 适时 地 采取 应 对 策略 ， 尽 最 大 努力 阻 
止 事件 的 进一步 发 酵 ， 以 将 负面 影响 降 到 最 低 。 

3) ”竞争 动向 

随 着 我 国 金融 领域 改革 的 不 断 深化 ， 金 融 业 的 竞争 也 日 益 激烈 。 因 此 ， 竞 争 对 手 的 一 
举 一 动 都 有 可 能 会 牵动 商业 银行 的 运营 安排 、 市 场 战略 的 实施 和 调整 。 商 业 银行 利用 大 数 
据 技术 对 网 络 与 情 进 行 监控 ， 不 仅 可 以 及 时 获取 自身 的 相关 信息 动向 ， 也 可 以 及 时 获取 竞 
争 对 手 的 信息 动向 。 对 竞争 对 手 的 网 络 与 情 进 行 分 析 可 以 为 商业 银行 制定 产品 战略 、 优 化 
客户 服务 等 活动 提供 客观 的 参考 依据 。 


3.5.4 案例 一 大 数据 分 析 助力 手机 银行 优化 创新 


随 着 手机 银行 产品 的 不 断 同 质 化 ， 拼 功能 、 拼 免费 的 阶段 已 经 逐步 退去 ， 质 量 过 硬 的 
产品 ， 极 致 、 极 简 的 客户 体验 ， 是 接 下 来 差异 化 发 展 的 趋势 。 通 过 大 数据 “深度 学 习 ” 制 
定 追 踪 指标 ， 可 以 辅助 产品 经 理 更 好 地 挖掘 用 户 需 求 、 洞 悉 客户 喜好 、 评 估 产 品 性 能 ， 实 
现 产 品 创新 优化 。 

江苏 银行 新 版 手机 银行 上 线 以 来 ， 极 力 打造 “只 为 你 、 更 懂 你 的 手机 银行 ”， 非 常 重 
视 相关 运营 数据 的 收集 和 分 析 工 作 ， 实 时 监控 后 台 运 行 ， 保 证 产品 性 能 稳定 ， 动 态 掌握 用 
户 行为 ， 分 析 功 能 受众 程度 ， 从 数据 中 挖掘 用 户 体验 反馈 ， 评 判 产品 功能 是 否 真正 改 到 了 
客户 的 痛 点 ， 为 手机 银行 的 优化 和 创新 提供 了 强 有 力 的 驱动 与 支撑 。 


1. 性 能 跟踪 


对 于 任何 一 项 产品 ， 性 能 稳定 是 基础 ， 没 有 稳定 的 性 能 保障 ， 多 样 的 功能 服务 、 流 畅 
的 UI 交互 皆 是 空谈 ， 相 当 于 直接 把 客户 拒 之 门 外 。 对 此 江苏 银行 监测 以 下 数据 ， 及 时 发 
现 并 解决 客户 使 用 中 出 现 的 问题 。 

(1) 安装 、 启 动 异 常 。 监 测 安装 、 启 动手 机 银行 APP 过 程 中 存在 的 问题 ， 记 录 报 错 机 
型 、 系 统 版 本 、APP 版 本 ， 便 于 分 析 解 决 问题 ， 诸 如 手机 银行 未 能 及 时 更 新 以 适用 最 新 版 
本 的 手机 系统 ， 不 支持 低 版 本 手机 系统 或 者 对 手机 剩余 存储 空间 有 要 求 。 

(2) 加 载 时 间 。 监 测 页 面 加 载 时 间 ， 尤 其 是 首 屏 。 据 TalkingData 统计 分 析 ， 使 用 手 
机 时 ， 如 果 页 面 加 载 超过 5 秒 钟 ，74% 的 客户 会 选择 离开 ， 因 此 ， 应 尽量 控制 首 屏 加 载 在 
450K/s 内 。 车 部 分 页 面 加 载 速度 明显 过 慢 ， 需 分 析 原 因 并 加 以 改进 ; 若 因 客 户 网 速 导 致 加 
载 缓慢 ， 应 及 时 以 亲 和 的 语言 予以 提示 ， 客 户 一 般 很 难 区 分 、 也 不 愿 主动 去 思考 其 无 法 顺 
畅 使 用 的 原因 ， 只 会 因此 对 产品 失望 而 选择 离开 。 
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(3) 使 用 中 的 异常 、 闪 退 。 监 测 运行 中 异常 、 闪 退 发 生 的 页 面 及 次 数 ， 记 录 报 错 机 
型 、 系 统 版 本 、APP 版 本 、 提 示人 信息， 便于 分 析 解 决 问题 。 

(4) 日 登录 客户 数 。 每 日 登录 过 手机 银行 的 客户 数 (区 分 新 登 客 户 、 存 量 客户 )。 掌 握 
手机 银行 日 登录 客户 数 的 动态 变化 ， 监 控 低 谷 ， 原 因 是 否 与 版 本 更 新 、 系 统 故 障 等 有 关 。 

(5) 使 用 时 长 。 统 计 客 户 单 次 操作 手机 银行 的 时 间 ， 分 析 会 话 时 间 低 于 某 一 阔 值 的 次 
数 占 比 ， 结 合 时 间 点 以 及 其 他 数据 分 析 可 能 原因 。 

2. 业务 流程 优化 

客户 使 用 手机 银行 产品 的 基本 诉求 就 是 顺畅 完成 目标 交易 ， 如 果 预 先 没有 相关 业务 提 
示 或 者 提示 不 明显 ， 导 致 客户 操作 过 程 中 、 甚 至 提交 之 后 才 发 现 不 能 继续 交易 ， 就 会 产生 
浪费 其 时 间 、 感 情 的 负面 情绪 ; 另外 ， 如 果 业 务 操 作 流程 不 够 人 性 化 ， 用 户 交互 步骤 不 够 
精简 ， 也 会 给 客户 带 来 急躁 甚至 愤怒 的 心理 反应 ， 对 此 江苏 银行 做 了 以 下 数据 追踪 。 

(1) 业务 中 断 提示 。 监 测 业务 不 能 继续 的 提示 页 面 及 次 数 ， 便 于 优化 流程 ， 预 先 做 好 
客户 引导 ， 提 升 体验 。 

(2) 漏斗 分 析 。 记 录 每 项 菜单 功能 每 个 步骤 页 面 的 访问 次 数 ， 停 留 时 长 ， 计 算 每 步 的 
转化 率 ， 根 据 最 后 停留 页 面 ， 找 出 客户 未 办 结业 务 或 快速 离开 (停留 时 间 低 于 规定 阐 值 ) 的 
原因 。 

(3) 跳出 率 。 监 测 客户 未 办 结 即 退出 手机 银行 的 菜单 页 面 和 次 数 占 比 ， 有 可 能 该 项 功 
能 的 体验 存在 较 大 问题 导致 客户 弃 用 。 

(4) 关联 操作 。 记 录 客 户 成 功 办 结 一 项 业务 之 后 的 页 面 操 作 ， 记 录 客 户 离开 当前 菜单 
后 进入 的 下 一 个 页 面 ， 为 产品 设计 的 进一步 优化 提供 思路 。 


3. 功能 优化 创新 


所 有 的 产品 功能 都 应 以 客户 为 中 心 ， 如 果 不 被 客户 接受 并 所 需 ， 即 为 零 。 对 此 江苏 银 
行 做 了 以 下 数据 统计 。 

(1) 菜单 点 击 量 、 平 均 停留 时 长 。 掌 握 客 户 常用 功能 ， 挖 掘 客户 潜在 需求 ， 优 化 现 有 

品 ， 加 强 相 应 功能 化 或 场景 化 产品 拓展 。 

(2) 交易 次 数 、 人 数 。 记 录 每 项 业务 交易 次 数 、 人 数 (区 分 办 结 /未 办 结 )， 尤 其 关注 版 
本 更 新 、 新 功能 上 线 、 功 能 优化 、 营 销 活动 发 布 等 时 间 节 点 的 交易 次 数 、 人 数 的 动态 变 
化 ， 对 比 同时 间 段 的 菜单 点 击 量 ， 若 点 击 量 远 大 于 交易 次 数 ， 分 析 客 户 对 新 功能 或 活动 接 
受 度 不 够 理想 的 原因 。 

(3) 登录 时 间 。 计 算 各 个 时 间 段 使 用 手机 银行 客户 占 比 ， 掌 握 峰 期 、 谷 期 ， 以 便 调整 
信息 、 活 动 的 推送 时 间 ， 进 一 步 对 登录 时 间 相 对 固定 的 客户 ， 实 现 更 适时 的 推送 。 

(4) 推送 信息 的 曝光 次 数 或 阅读 量 。 记 录 新 产品 或 营销 活动 上 线 ， 告 知客 户 时 客户 的 
阅读 量 和 引导 提示 曝光 次 数 ， 结 合 产品 同时 间 段 的 点 击 量 、 交 易 量变 化 ， 对 比分 析 产 品 或 
活动 的 宣传 效果 。 

(5) 分 享 次 数 。 对 于 具有 分 享 功能 的 页 面 ， 记 录 客 户 分 享 次 数 ， 记 录 截 屏 页 面 及 相应 
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OD 
次 数 


未 来 的 银行 不 只 是 数据 的 银行 ， 更 要 是 数据 分 析 和 数据 解决 的 银行 。 做 一 款 有 温度 


的 、 让 客户 留恋 的 手机 银行 ， 同 样 也 离 不 开 数 字 化 运营 。 无 论 是 领先 的 产品 创新 、 到 位 的 
功能 优化 还 是 精准 的 营销 管理 、 实 时 的 风险 监控 ， 都 需要 从 数据 中 摄取 价值 。 本 文 简 述 的 
运营 数据 分 析 仅 走出 了 “大 数据 ”学 习 的 一 小 步 ， 加 强 内 外 部 数据 整合 能 力 、 数 据 分 析 应 
用 能 力 和 数据 辅助 决策 能 力 将 成 为 量 质 并 举 的 前 提 下 争夺 移动 端 市 场 的 关键 。 江 苏 银行 手 
机 银行 秉承 以 客户 需求 和 体验 为 中 心 ， 积 极 拥抱 “大 数据 ”技术 ， 不 断 超越 、 突 破 ， 为 客 
户 打造 了 一 个 即 需 即 用 、 便 捷 贴心 的 移动 银行 。 
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本 章 总 结 


商业 银行 在 长 期 的 金融 服务 中 ， 积 累 了 大 量 的 信息 数据 ， 这 些 数据 涵盖 了 客户 的 
个 人 基本 资料 、 收 入 情况 、 生 活 方式 以 及 过 往 接受 金融 服务 的 历史 记录 等 相关 资 
料 ， 可 以 通过 利用 先进 的 数据 库 系统 和 大 数据 挖掘 及 分 析 技 术 ， 对 其 所 掌握 的 客 
户 信息 进行 充分 的 利用 ， 进 而 实现 多 个 维度 的 客户 细 分 。 

在 大 数据 技术 的 应 用 下 ， 商 业 银 行 可 以 及 时 发 现 客户 尚未 被 满足 的 需要 和 对 现 有 
服务 的 不 满 ， 及 时 采取 恰当 的 行动 解决 客户 的 诉求 ， 从 而 在 客户 结束 其 与 银行 的 
业务 关系 之 前 ， 及 时 对 客户 进行 挽留 ， 最 大 限度 地 减少 客户 的 流失 。 

在 商业 银行 向 客户 提供 增值 服务 的 过 程 中 ， 通 过 应 用 大 数据 技术 能 够 发 现 客户 尚 
未 被 满足 的 服务 需求 ， 从 而 有 意识 地 完善 和 提高 客户 在 商业 银行 各 渠道 中 的 服务 
体验 ， 提 高 客户 黏 性 。 

大 数据 在 商业 银行 的 客户 生命 周期 管理 中 充分 的 应 用 ， 进 而 能 够 帮助 商业 银行 进 
行 实时 营销 、 交 叉 营 销 、 社 交 化 营销 和 个 性 化 推荐 。 

大 数据 可 以 帮助 商业 银行 在 创新 模式 下 进行 贷款 风险 评估 。 通 过 利用 大 数据 技术 
商业 银行 能 够 从 多 个 维度 获取 客户 信息 ， 并 利用 有 效 的 风险 计量 技术 对 其 所 面临 
的 贷款 风险 进行 合理 评估 。 

在 大 数据 技术 的 应 用 下 ， 商 业 银 行 可 以 对 信用 卡 客户 的 信贷 风险 进行 实时 监控 ， 
并 根据 监控 结果 及 时 对 客户 的 授信 额度 做 出 调整 。 

大 数据 风险 控制 的 优势 主要 体现 在 大 数据 征 信 的 利用 价值 上 。 第 一 ， 大 数据 使 商 
业 银 行 的 客户 信用 风险 评估 纳入 了 多 样 化 的 行为 数据 ， 这 些 数据 覆盖 范围 广泛 且 
具有 实时 性 ; 第 二 ， 在 大 数据 风险 控制 中 ， 信 用 评价 更 加 精准 ;第 三 ， 大 数据 风 
险 控制 中 对 客户 信用 的 评判 更 具 时 效 性 。 

大 数据 在 商业 银行 的 反 苏 诈 和 反 洗 钱 工 作 中 也 能 发 挥 其 在 数据 处 理 和 分 析 中 的 独 
特 优势 。 

大 数据 能 够 很 好 地 帮助 商业 银行 对 其 市 场 和 渠道 分 析 、 产 品 及 服务 进行 优化 ， 还 
能 够 帮助 商业 银行 对 网 络 与 情 进行 分 析 从 而 优化 其 日 常 运营 。 
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本 章 作业 


客户 细 分 都 有 哪些 类 型 ? 

- 大 数据 是 如 何 帮 助 商业 银行 进行 客户 流失 预测 、 渠 道 管理 优化 和 提供 增值 服务 的 ? 
. 什么 是 客户 生命 周期 管理 ? 大 数据 在 其 中 如 何 发 挥 作 用 ? 

. 简要 概括 大 数据 如 何 帮 助 商业 银行 进行 实时 营销 、 交 叉 营 销 、 社 交 化 营销 和 个 性 化 


Co LT 


推荐 。 

5. 传统 的 贷款 风险 评估 面临 哪些 挑战 ?大 数据 又 是 如 何 帮助 商业 银行 进行 贷款 风险 评 
估 的 ? 

6. 简 述 大 数据 在 信用 卡 自动 授信 中 是 如 何 应 用 的 。 

7. 大 数据 风险 控制 与 传统 风险 控制 有 哪些 区 别 ? 大 数据 是 如 何 帮助 商业 银行 进行 风险 
管理 的 ? 

8. 简 述 大 数据 是 如 何在 商业 银行 反 欺 诈 和 反 洗 钱 工作 中 发 挥 作 用 的 。 

9. 大 数据 如 何 实现 对 商业 银行 运营 的 优化 ? 
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第 4 章 


大 数据 在 证 券 行业 中 的 应 用 


Q 
从 
 。 富 瓜 大 数据 技术 在 股价 预测 中 e。 了 解 大 数据 技术 在 投资 情绪 分 
标 具体 应 用 析 中 的 应 用 

@ 熟悉 如 何 用 大 数据 技术 进行 证 。 @ 掌握 大 数据 技术 在 证 券 量化 投 

券 客户 关系 管理 资方 面 的 应 用 

Q 在 金融 行业 中 ， 证 券 业 属于 数据 密集 型 行业 ， 积 累 了 上 市 公司 财务 报表 、 客 户 
| 关系、 市 场 信息 、 交 易 数据 等 大 量 信息 ， 伴 随 着 时 间 的 增长 和 上 市 公司 数量 的 不 断 
局 增加 ， 其 数据 已 呈 指 数 型 增长 趋势 。 而 这 些 数据 的 分 析 和 处 理 对 投资 者 、 券 商 乃至 
四 汉 整个 证 券 市 场 来 说 是 至 关 重 要 的 。 例 如 ， 一 家 券商 发 布 的 一 份 股票 研究 报告 就 很 可 


能 会 影响 投资 者 或 者 其 他 券商 的 投资 决策 ， 进 而 对 整个 证 券 市 场 产生 影响 。 券 商 为 
了 应 对 激烈 的 同业 竞争 ， 也 都 争 相 把 大 数据 技术 作为 保护 自己 市 场地 位 的 有 力 武 
器 。 随 着 大 数据 技术 的 成 熟 和 证 券 市 场 的 网 络 化 ， 大 数据 目前 已 经 应 用 于 证 券 行业 
的 方方面面 。 本 章 主 要 从 股票 分 析 、 客 户 关 系 管理 、 投 资 情绪 以 及 量化 投资 方面 出 
发 ， 介 绍 大 数据 技术 在 证 券 行业 中 的 应 用 。 


人 大 数据 金融 与 征 信 


Boies 


(OD 到 大 数据 在 股票 分 析 中 的 应 用 


票 分 析 主 要 分 为 技术 分 析 和 基本 面 分 析 两 大 类 ， 其 中 技术 分 析 主 要 由 交易 策略 和 买 
卖 时 机 构成 ， 基 本 面 分 析 主 要 由 股票 选择 和 投资 组 合 构成 。 大 数据 技术 的 应 用 主要 体现 在 
数据 挖掘 上 ， 在 基本 面 分 析 方 面 ， 主 要 运用 的 是 决策 树 、 聚 类 分 析 两 类 研究 方法 ， 在 技术 
分 析 方 面 ， 主 要 运用 的 是 人 工 神经 网 络 (BP)、 基 因 遗 传 、 决 策 树 、 关 联 分 析 等 。 
在 数据 分 析 时 ， 一 般 会 以 某 段 时 间 中 国 宏观 股市 数据 或 上 市 公司 相关 资料 为 基础 ， 运 
用 SPSS、SAS 等 工具 对 数据 进行 处 理 、 算 法 改进 以 及 数据 挖掘 工作 。 根 据 所 采用 的 挖掘 
方法 的 不 同 ， 所 处 理 方法 如 下 。 


4.1.1 基于 基本 面 分 析 的 数据 挖掘 方法 


基本 面 分 析 ， 广 义 上 是 指 以 经 济 学 的 供求 关系 原理 为 基础 ， 通 过 以 判断 金融 市 场 的 未 
来 走势 为 目标 对 历史 的 经 济 和 政治 数据 进行 分 析 。 分 析 因 素 主 要 有 宏观 经 济 状况 、 利 率 水 
平 、 通 货 膨 胀 、 企 业 素质 、 政 治 因素 等 。 狭 义 的 基本 面 分 析 通 常 是 指 广义 基本 面 分 析 中 的 
企业 素质 ， 分 析 因 素 主要 包括 企业 财务 报表 、 行 业 状 况 、 管 理 层 素质 、 产 品 的 市 场 竞 争 力 
等 ， 如 表 4.1 所 示 。 


表 4.1 基本 面 分 析 中 的 主要 分 析 因 素 


主要 因素 
市 一 率 / 市 净 率 / 净 资 产 收益 率 /流动 比率 /销售 净利 润 ; 
每 股 收益 /每 股 净 资产 /每 股利 息 分 配 ; 
成 本 费用 率 /负债 比率 。 现 金 比 率 / 应 收 账 款 周转 率 


基本 面 分 析 


企业 财务 报表 分 析 


行业 分 析 行业 类 别 /行业 成 长 度 
企业 产品 市 场 竞争 力 分 析 市 场 占 有 率 /市 场 价格 /销售 能 力 /原材料 价格 
公司 文化 和 管理 层 素质 管理 层 能 力 /企业 内 部 协调 能 力 

1. 决策 树 


以 ID3 算法 为 主 ， 按 照 投 资 者 所 感 兴趣 的 指标 (财务 比率 、 流 通 比例 等 ) 来 挖掘 出 符合 
投资 者 需求 的 上 市 公司 。 为 了 寻找 其 规则 和 先后 顺序 (建立 决策 树 )， 首 先 将 资料 按照 投资 
者 需求 做 数据 预 处 理 ， 然 后 预 处 理 后 的 资料 分 成 训练 样本 和 测试 样本 ， 训 练 资料 中 以 Gain 
最 大 者 为 根 节 点 ， 建 立 决策 树 ， 再 由 决策 树 建立 分 类 规则 ; 最 后 以 分 类 规则 寻找 股市 中 符 
合 要 求 的 公司 。 

2. 关联 分 析 


以 划分 算法 为 主 ， 对 于 投资 者 所 感 兴趣 的 股票 ， 根 据 各 项 财务 指标 对 其 进行 分 析 ， 从 
中 找 出 最 佳 的 投资 组 合 。 


3. 聚 类 分 析 


以 自 组 织 映射 COMD) 聚 类 算法 为 主 ， 对 于 投资 者 给 定 的 一 组 具备 属性 值 的 个 股 资料 ， 
找 出 一 个 能 够 按照 属性 值 将 个 股 聚 类 的 模式 ， 使 得 属于 同一 聚 类 内 的 个 股 的 相似 性 最 大 
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化 ， 不 同 聚 类 间 的 个 股 相似 性 最 小 化 ， 并 分 析出 没 在 个 股 属性 中 显示 而 是 隐 含 在 各 聚 类 中 
的 共同 特性 。 


4. 人 工 神 经 网 络 

以 投资 者 感 兴趣 的 财务 指标 、 负 债 情况 、 盔 利 能 力 为 分 析 变 量 建立 前 向 式 的 神经 网 络 
模型 ， 并 通过 分 析 找 到 最 佳 投资 组 合 。 

5. 逻辑 回归 

以 投资 者 提供 的 个 股 基 本 面 指标 为 变量 建立 二 元 逻辑 回归 模型 ， 从 个 股 中 找 出 最 佳 投 
资 组 合 。 
4.1.2 ”基于 技术 分 析 的 数据 挖掘 方法 

1. 决策 树 


以 C4.5 算法 为 基础 ， 首 先 将 投资 者 对 股票 买点 的 规则 要 求 作为 分 类 样本 ， 将 买点 分 类 
为 “+”、“- ”两 类 群体 ， 再 将 投资 者 所 需要 分 析 的 指标 作为 自 变量 ， 最 后 利用 决策 树 产 
生 的 “+” 类 群体 的 分 类 规则 来 找 出 自 变 量 的 有 效 区 间 并 从 中 筛选 出 “有 效 买 点 ”。 


2. 人 工 神经 网 络 

以 BP 算法 为 主 ， 由 投资 者 提供 的 个 股 历史 价格 数据 集 通过 训练 一 学 习 的 循环 过 程 来 
预测 未 来 某 一 时 间 段 的 价格 ， 提 示 投 资 者 最 佳 入 场 时 机 。 

3. 时 间 序 列 分 析 


按照 投资 者 指定 的 个 股 和 板块 指数 ， 对 其 价格 走势 进行 分 析 并 建立 ARIMA 模型 ， 利 
用 历史 价格 变动 来 预测 在 未 来 一 段 时 间 内 的 价格 走势 。 


4. 关联 分 析 


以 Apriority 算法 为 基础 ， 通 过 投资 者 给 定 技术 指标 以 及 投资 者 指定 的 个 股 历史 信息 ， 
找到 能 够 以 其 中 某 些 指标 的 出 现 与 否 来 预测 其 他 指标 出 现 与 否 的 规则 。 各 类 算法 在 分 析 与 
预测 中 的 作用 如 表 4.2 所 示 。 


表 4.2 基于 基本 面 分 析 和 技术 分 析 的 算法 分 类 


股票 分 析 与 预测 

数据 挖掘 算法 
决策 树 
人 工 神经 网 络 


注意 : O 〇 代表 可 行 ，X 代 表 不 可 行 。 
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接 下 来 介绍 主要 的 3 种 分 析 方法 : 决策 树 法 、 聚 类 分 析 法 、 人 工 神经 网 络 算法 。 


4.1.3 决策 树 法 的 应 用 


决策 树 算法 (Decision tree) 是 一 种 逼近 离散 函数 值 的 方法 : 它 是 一 种 典型 的 分 类 方法 ， 
首先 对 数据 进行 处 理 利用 归纳 算法 生成 可 读 的 规则 和 决策 树 ， 然 后 使 用 决策 树 对 新 数据 进 
行 分 析 。 本 质 上 决策 树 是 通过 一 系列 规则 对 数据 进行 分 类 的 过 程 。 它 的 树 状 结构 由 根 节 
点 、 内 部 节点 、 分 支 以 及 叶 节点 构成 。 整 棵 树 的 结构 分 各 部 分 展示 了 对 数据 进行 分 类 的 过 
程 。 决 策 树 通过 对 每 个 节点 进行 属性 值 的 比较 而 得 到 分 支 ， 并 在 各 叶 节 点 得 出 分 类 结果 。 
从 决策 树 的 根 到 叶 的 每 一 条 路 径 就 是 对 应 的 条 分 类 规则 ， 因 此 从 决策 树 非常 容易 转换 成 分 
类 规则 。 

决策 树 法 在 股票 基本 分 析 和 技术 分 析 中 的 模型 思路 大 致 是 相同 的 ， 但 是 两 者 所 需 选取 
的 变量 是 不 同 的 。 

1. 基本 面 分 析 的 变量 选取 

采用 个 股 财 务 报表 中 的 流动 比率 、 速 动 比率 、 资 产 负债 率 、 销 售 毛利 率 、 销 售 成 本 
率 、 销 售 期 间 费 用 率 、 资 产 净 利率 、 净 资产 收益 率 摊薄 、 主 营业 务 利润 率 、 营 业 利润 率 、 
股东 权益 率 、 净 资产 增长 率 、 净 利润 增长 率 、 主 营业 务 利润 增长 率 、 主 营业 务 收入 增长 
率 、 营 业 利润 增长 、 每 股 营 业 利 润 、 每 股 主 营 业务 利润 、 每 股 主 营业 务 收 入 、 每 股 资本 公 
积 金 等 自 变 量 。 另 外 ， 可 以 设 定 一 个 新 变量 “个 股 赢 率 ”作为 二 元 目标 变量 。 若 个 股 年 累 
积 收益 大 于 流通 市 值 加 权 市 场 年 累计 收益 ， 则 个 股 鼻 率 为 1， 相反 则 为 0。 

值得 注意 的 是 ， 为 了 保证 模型 实证 的 有 效 性 ， 基 本 面 分 析 所 选取 的 指标 需要 进行 一 定 
的 筛选 ， 筛 选 的 条 件 如 下 。 

(1) 研究 期 间 所 选取 样本 具备 完整 的 财务 报表 数据 。 

(2) 研究 期 间 所 选取 样本 的 停牌 时 间 不 得 超过 半年 。 

(3) 所 选取 样本 近期 未 发 生 资产 重组 等 影响 模型 有 效 性 的 重大 事件 。 


2. 技术 分 析 的 变量 选取 


采用 20 日 移动 平均 日 收益 方差 、20 日 移动 平均 日 收益 标准 差 、20 日 移动 平均 流通 市 
值 加 权 日 市 场 收 益 方差 、20 日 移动 平均 流通 市 值 加 权 日 市 场 收益 标准 差 、20 日 移动 平均 
总 市 值 加 权 日 市 场 收益 方差 、60 日 移动 平均 总 市 值 加 权 日 市 场 收益 标准 差 、60 日 移动 平 
均 日 收益 方差 、60 日 移动 平均 日 收益 标准 差 、60 日 移动 平均 流通 市 值 加 权 日 市 场 收益 方 
差 、60 日 移动 平均 流通 市 值 加 权 日 市 场 收益 标准 差 、60 日 移动 平均 总 市 值 加 权 日 市 场 收 
益 方差 、60 日 移动 平均 总 市 值 加 权 日 市 场 收益 标准 差 、 换 手 率 、 日 振幅 、 市 和 盈 率 、 波 动 
率 、 日 简单 平均 移动 波动 率 、20 日 简单 平均 移动 波动 率 、60 指数 加 权 移 动 平均 波动 率 、 
成 交 量 等 自 变量 ， 并 另外 定义 一 新 变量 “下 一 日 涨 跌 ” 为 二 元 目标 变量 ， 若 下 一 日 涨 则 产 
生 买 点 ， 设 为 1， 反 之 则 产生 卖点 ， 设 为 0。 

对 于 决策 树 二 进 制 的 目标 变量 ， 主 要 有 以 下 划分 规则 。 

(1) 检验 一 Pearson 用 于 衡量 目标 变量 ， 并 依 其 建立 分 支 节点 。 
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(2) 炳 值 约 简 一 一 通过 对 粹 值 大 小 的 衡量 反映 节点 不 纯 性 ， 也 称 为 灶 不 纯 性 。 

(3) 基尼 系数 约 简 一 一 通过 对 基尼 系数 大 小 的 衡量 反映 结 点 不 纯 性 ， 也 称 为 Gini 不 纯 性 。 

模型 中 叶 节点 的 设 定 主要 有 节点 最 小 观测 数 、 叶 子 的 最 小 观测 数 、 节 点 最 大 分 支 数 、 
决策 树 最 大 层 数 ， 如 图 4.1 所 示 。 


图 4.1 决策 树 模型 结构 


在 成 功 建立 模型 后 便 可 以 得 出 决策 树 分 类 结果 ， 得 出 训练 数据 与 检验 数据 误差 最 小 的 
叶子 ， 根 据 分 类 规则 可 以 判断 每 个 筛选 出 的 指标 对 因 变 量 的 显著 性 。 并 在 此 基础 之 上 ， 便 
可 以 通过 决策 树 模型 对 个 股 赢 率 / 股 票 的 买卖 点 进行 预测 。 模 型 中 对 预测 的 结果 也 有 正确 率 
的 估计 。 证 券 经 营 机 构 参 考 模型 的 预测 结果 和 预测 正确 率 ， 能 够 更 好 地 确定 投资 策略 、 发 
布 研 究 报告 、 提 供 投资 顾问 服务 等 。 


4.1.4 聚 类 分 析 法 的 应 用 


聚 类 分 析 是 对 大 量 事先 并 未 知晓 其 属性 的 数据 集 ， 按 照 数据 的 内 在 相似 性 将 数据 集 划 
分 为 多 个 类 别 ， 使 类 别 内 的 数据 相似 度 较 大 而 类 别 间 的 数据 相似 度 较 小 。 聚 类 分 析 能 够 作 
为 一 个 独立 的 分 析 工 具 获 得 数据 的 分 布 情况 ， 以 便 观 察 每 一 类 数据 的 特征 ， 集 中 对 特定 的 
数据 群 进行 进一步 分 析 。 

应 用 到 股票 分 析 中 ， 可 通过 提供 一 定 的 时 间 段 ， 将 该 期 间 的 股票 数据 进行 分 类 ， 从 中 
发 现 获 利 大 而 风险 小 的 聚 类 ， 作 为 证 券 自 营业 务 部 门 或 者 投资 者 的 参考 。 

具体 分 析 方 法 如 下 。 

(1) 确定 聚 类 分 析 的 时 间 段 、 股 票 板块 以 及 个 股 。 

(2) 选取 个 股 重要 的 财务 指标 进行 分 析 ， 包 括 归属 母 公 司 净利 润 、 每 股 收益 摊薄 、 销 
售 净利 率 、 销 售 毛 利率 、 营 业 成 本 率 、 期 间 费 用 率 、 销 售 费 用 率 、 管 理 费 用 率 、 财 务 费 用 
率 、 营 业 利润 率 、 成 本 费用 利润 率 、 应 收 账 款 周转 率 、 总 资产 周转 率 、 总 资产 收益 率 、 净 
资产 收益 率 摊薄 、 营 业 收 入 现金 含量 、 销 售 现金 比率 、 净 利润 现金 含量 等 。 
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(3) 设计 模型 。 

中 数据 缺失 值 处 理 。 

采用 均值 处 理 方式 为 0 或 为 空 的 数值 赋值 。 

@ 数据 标准 化 。 

由 于 聚 类 分 析 对 各 变量 间 的 数据 规模 差异 十 分 敏感 ， 因 此 将 各 变量 转化 为 均值 为 0、 
方差 为 1 的 新 变量 。 

@ ”模型 参数 设 定 。 

将 分 类 结果 以 1，2… 的 形式 标识 为 该 聚 类 的 ID， 以 方便 对 结果 的 分 析 。 同 时 设置 最 
小 平方 数 为 聚 类 标准 。 另 外 ， 根 据 数据 的 具体 情况 确定 最 小 聚 类 数 以 及 最 大 聚 类 数 。 

(4) 得 出 实证 结果 。 

建立 模型 后 ， 模 型 会 把 数据 分 为 几 个 聚 类 ， 并 得 到 所 有 变量 标准 均值 以 及 每 一 聚 类 变 
量 标准 均值 的 分 布 情况 。 通 过 对 每 个 聚 类 具体 情况 的 分 析 ， 可 以 确定 哪 一 类 适合 进行 
投资 。 

中 若 股票 的 净利 润 、 净 资产 收益 率 、 每 股 收益 、 营 业 利润 率 等 衡量 上 市 公司 获 利 能 
力 的 指标 均 明显 高 于 整个 板块 ， 而 它 的 应 收 账 款 周转 率 、 期 间 费 用 率 、 管 理 费 用 率 、 销 售 
费用 率 等 衡量 上 市 公司 运作 成 本 的 指标 均 明显 低 于 整个 板块 ， 这 类 股票 适合 进行 长 期 
投资 。 

@@ 若 公司 总 体 获 利 能 力 的 指标 明显 高 于 整个 块 ， 并 且 高 于 上 述 (1) 情 形 ， 但 它 的 营业 
成 本 率 、 财 务 费 用 率 、 应 收 账 款 周转 率 均 低 于 该 板块 整体 水 平 ， 说 明 该 类 企业 获得 巨额 收 
益 的 同时 也 付出 了 大 量 的 成 本 或 者 说 所 获 收 益 短期 内 难以 回笼 。 这 类 股票 适合 进行 短期 
投资 。 

@@ 若 公司 的 总 体 获 利 能 力 以 及 上 市 公司 的 运作 成 本 均 低 于 整个 板块 ， 那 么 这 类 股票 
不 适合 进行 投资 。 


4.1.5 人工 神经 网 络 算法 的 应 用 


人 工 神 经 网 络 是 对 人 脑 或 自然 神经 网 络 的 基本 特性 的 抽象 和 模拟 ， 它 是 通过 模拟 大 脑 
的 一 些 机 理 和 机 制 ， 实 现 某 种 功能 。 有 具体 来 说 ， 它 是 一 组 连接 输入 、 输 出 单元 ， 其 中 每 个 
连接 都 和 一 个 权重 相关 ， 通 过 调整 这 些 权重 ， 能 够 预测 输入 数据 的 正确 类 标号 。 根 据 网 络 
的 层次 数 ， 人 工 神经 网 络 可 以 分 为 两 层 神经 网 络 、 三 层 神经 网 络 和 多 层 神 经 网 络 。 其 中 最 
常用 的 就 是 三 层 神经 网 络 。 

这 里 的 人 工 神经 网 络 算法 主要 指 的 是 误差 反 向 传播 算法 (BP 算法 )， 它 是 一 种 监督 式 学 
习 的 人 工 神经 网 络 ， 能 将 错误 的 讯号 反馈 回来 ， 以 便 及 时 修正 权重 。BP 算法 网 络 分 为 三 
层 ， 分 别 为 输入 层 、 隐 藏 层 与 输出 层 ， 并 通过 转换 函数 的 进行 人 工 神经 网 络 的 网 络 训练 ， 
如 图 4.2 所 示 。 

(1) 输入 层 。 接 收 外 部 环境 输入 信息 ， 其 处 理 单元 即 为 变数 个 数 。 
(2) 隐藏 层 。 为 人 工 神经 网 络 中 最 重要 的 部 分 ， 通 常 为 一 到 两 层 ， 也 可 以 没有 隐 


藏 层 
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输入 层 隐藏 层 输出 层 


图 4.2 BP 算法 流程 


(3) 输出 层 。 输 出 网 络 的 处 理 结果 ， 输 出 层 的 处 理 单元 数 为 研究 问题 所 要 得 到 的 结果 
个 数 。 


1. 基于 人 工 神经 网 络 算法 的 股票 基本 面 分 析 


1) 样本 选择 
选择 上 市 股票 一 段 时 间 的 一 定数 量 股票 的 发 展 能 力 数 据 和 季度 报酬 率 数据 。 
2) ”变量 选取 


将 上 市 公司 发 展 能 力 的 指标 作为 输入 变量 ， 包 括 主 营业 务 收入 增长 率 、 营 业 利润 增长 
率 、 利 润 总 额 增长 率 、 净 利润 增长 率 、 净 资产 增长 率 、 流 动 资产 增长 率 、 固 定 资产 增长 
率 、 总 资产 增长 率 、 挫 薄 每 股 收 益 增长 率 、 每 股 净 资产 增长 率 等 10 个 指标 。 另外， 将 个 
股 赢 率 作为 输出 变量 ， 并 把 它 分 为 3 类 。 第 一 类 (个 股 赢 率 >0.052) 代 表 个 股 当 季 表 现 优 于 
大 益 ， 第 二 类 (-0.092 志 个 股 赢 率 三 0.052) 代 表 个 股 当 季 表 现 与 大 盘 相 当 ; 第 三 类 (个 股 赢 率 
一-0.092)， 表 示 个 股 当 季 明 显 劣 于 大 盘 。 


3) ”模型 建立 
(1) 将 输入 变量 做 标准 化 处 理 ， 其 公式 为 
= (4.1) 
be 
(2) 隐藏 层 。 


隐藏 层 中 相关 参数 包括 采用 神经 元 个 数 、 层 数 、 激 活 函 数 、 联 合 函数 共 4 项 ， 说 明 
如 下 。 

也 层 数 。 该 参数 值 的 决定 方法 各 不 相同 ， 但 大 部 分 学 者 均 认 为 该 值 为 4 以 下 并 不 会 
影响 神经 网 络 的 训练 结果 。 因 此 ， 隐 藏 层 根据 具体 情况 可 以 设置 为 1、2 或 者 3 层 。 


Wh 


人 大 数据 金融 与 征 信 


@ 神经 元 个 数 。 一 般 认 为 ， 神 经 元 个 数 应 大 于 等 于 输入 变量 个 数 和 输出 变量 个 数 的 
最 小 值 ， 小 于 等 于 输出 变量 和 输出 变量 个 数 之 和 ， 在 建 模 过 程 中 根据 上 述 规则 设置 合理 的 
参数 范围 ， 并 采用 试 凑 法 进行 逐一 尝试 。 

图 激活 函数 。 常 用 的 激活 函数 有 Logistics 函数 、 双 曲 正 切 函数 、 反 正切 函数 、 高 斯 
函数 ，Logistics 函数 适应 性 更 强 ， 故 一 般 将 其 作为 激活 函数 。 

@ 联合 函数 。 联 合 函 数 分 为 曲线 连接 和 线性 连接 ， 一 般 以 线性 连接 为 主 。 

(3) 输出 层 。 

在 输出 层 中 主要 有 输出 变量 、 误 差 和 误差 函数 3 项 参数 。 

@ 输出 变量 : 由 于 前 面 将 个 股 赢 率 分 为 3 个 类 别 ， 因 此 根据 这 3 个 类 别 所 对 应 的 分 
布设 计 为 3 个 输出 变量 ， 取 值 在 0 到 1 之 间 ， 用 其 作为 评判 股票 季度 表现 的 指标 ， 当 预测 
值 落 在 该 类 别 的 概率 大 于 1/3 时 ， 说 明 个 股 属于 该 类 别 的 可 能 性 较 高 ， 概 率 越 大 可 能 
越 高 。 

@ 误差 : 误差 计算 方式 为 输出 处 理 单元 与 目标 值 之 间 差 异 平方 和 的 一 半 ， 其 公式 为 

EQW=T- Td -ny (2) 


其 中 ，w 代表 网 络 中 所 有 权重 之 和 ; 4 代表 第 一 个 输出 神经 元 的 实际 值 ， 即 个 股 的 真实 赢 
率 ; jy 代 表 第 一 个 输出 神经 元 的 预测 值 ， 即 个 股 的 预测 赢 率 。 

@ 误差 函数 。 

误差 函数 主要 有 伯 努 利 函 数 、 多 重 伯 努 利 函 数 、Logistics 函数 、 柯 西 函数 等 。 在 股票 
基本 面 分 析 中 ， 多 重 伯 努 利 函 数 更 适用 。 

4) ” 建 模 过 程 

(1) 将 网 络 结构 设置 为 Multilayer Perception(MLP) 结 构 ， 模 型 标准 设置 为 ProfiVLoss， 
即 设置 了 损失 矩阵 的 模型 。 

(2) 将 收集 的 数据 的 70% 作 为 训练 数据 ， 得 出 历史 个 股 赢 率 的 统计 。 

(3) 用 试 次 法 逐一 测试 选 出 最 小 误差 ， 得 出 最 优 节点 。 

(4) 选取 一 定 的 股票 最 近期 间 的 发 展 能 力 指标 为 输入 变量 ， 对 其 下 一 季度 的 个 股 赢 率 
进行 预测 ， 得 出 预测 结果 。 

2. 基于 人 工 神经 网 络 算法 的 股票 技术 分 析 


人 工 神 经 网 络 算法 应 用 于 技术 分 析 ， 是 将 股票 的 技术 指标 作为 分 析 变 量 ， 通 过 分 析 一 
段 历史 时 期 内 的 股票 技术 指标 的 变动 来 预测 股票 未 来 走势 。 其 选用 的 模型 和 模型 设计 过 程 
与 上 述 基本 分 析 相 类 似 ， 主 要 不 同 在 于 变量 的 选取 以 及 预测 方面 。 

在 变量 选取 方面 ， 一 般 选取 个 股 研究 期 间 内 的 短期 技术 指标 作为 变量 ， 主 要 是 指 : 每 
日 9:30 至 15:00 期 间 每 五 分 钟 涨幅 、 每 日 涨幅 、 每 日 振幅 、 每 日 成 交 量 涨幅 、 每 日 上 证 综 
指 涨幅 、 隔 日 开盘 涨幅 等 6 个 指标 。 

此 外 ， 将 下 一 日 的 开盘 价 涨幅 作为 目标 变量 。 下 一 日 开盘 价 涨幅 =( 前 一 日 收盘 价 -下 一 
日 收盘 价 )* 前 一 日 收盘 价 。 

预测 方面 ， 与 基本 面 分 析 不 同 ， 技 术 分 析 主 要 分 为 3 个 部 分 ， 有 具体 说 明 如 下 。 
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(1) 输入 预测 数据 集 。 将 预测 样本 输入 数据 集 ， 并 设置 隔日 开盘 涨幅 为 目标 变量 。 

(2) 打分 。 将 3 个 层 的 训练 过 程 进行 打分 ， 并 将 得 分 代码 应 用 到 预测 数据 集 。 

(3) 预测 。 对 预测 时 间 段 的 隔日 开盘 涨幅 进行 预测 值 与 实际 值 的 比较 。 

最 终 通过 建立 拟 合 方程 ， 得 出 预测 值 与 真实 值 之 间 的 关系 ， 从 而 为 投资 决策 提供 
参考 


(OO 客户 关系 管理 


客户 关系 管理 (Customer Relationship Management，CRM) 是 一 个 获取 、 保 持 和 增加 可 
获 利 客户 的 方法 和 过 程 ， 通 过 提高 客户 的 忠诚 度 而 最 终 提高 企业 利润 率 。 

证 券 公司 通过 实施 客户 关系 管理 ， 提 供 快速 、 周 到 的 优质 服务 ， 可 吸引 和 保持 更 多 客 
户 ， 从 而 提高 核心 竞争 力 。 要 做 好 客户 关系 管理 ， 证 券 公司 应 当 利用 大 数据 技术 对 客户 的 
信息 做 深入 的 分 析 ， 做 好 客户 细 分 ， 为 不 同 的 客户 提供 个 性 化 服务 。 同 时 也 要 对 流失 客户 
进行 科学 的 分 析 和 预测 ， 使 证 券 公司 能 够 尽早 提出 相应 措施 ， 避 免 客户 流失 或 者 使 客户 流 
失 最 小 化 。 


4.2.1 客户 细 分 


国内 证 券 公司 拥有 大 量 的 客户 群 ， 客 户 多 种 多 样 ， 对 于 不 同 的 客户 ， 他 们 的 需求 也 有 
所 不 同 。 证 券 公司 受 自身 条 件 的 限制 ， 不 能 同时 满足 所 有 客户 的 需求 ， 因 此 采取 客户 细 分 
策略 对 于 证 券 公 司 优化 资源 配置 、 证 券 公司 内 部 管理 、 实 现 券商 价值 最 大 化 都 起 到 了 至 关 
重要 的 作用 。 


1. 证 券 客 户 细 分 的 作用 


第 一 ， 对 客户 进行 细 分 ， 设 置 相对 应 的 客户 级 别 。 筛 选 出 其 中 最 有 价值 的 客户 ， 并 且 
针对 这 些 客户 采取 个 性 化 服务 ， 有 助 于 提高 客户 的 忠诚 度 与 满意 度 。 

第 二 ， 有 助 于 证 券 公司 探索 到 新 的 市 场 机 会 。 

第 三 ， 有 助 于 证 券 公 司 研发 新 的 金融 产品 ， 以 满足 客户 的 需求 。 

第 四 ， 有 助 于 证 券 公司 挖掘 高 净值 客户 ， 加 强 对 高 净值 客户 的 抢夺 力度 ， 提 高 公司 竞 
争 力 。 


2. 客户 细 分 模型 


1) ”客户 等 级 体系 模型 

为 了 在 客户 细 分 的 研究 中 建立 完整 的 功能 结构 模型 ， 在 此 基础 上 建立 一 套 标准 的 客户 
细 分 模型 一 一 客户 细 分 的 DFM 模型 。 该 模型 包括 数据 (Data)、 功 能 (Function) 及 方法 (Method) 
3 个 部 分 ， 因 此 将 此 模型 命名 为 客户 细 分 的 DFM 模型 ， 如 图 4.3 所 示 。 

目前 ， 简 单 的 传统 的 客户 信息 模型 体系 已 经 不 能 适应 证 券 公司 开发 和 营销 集合 理财 产 
品 和 服务 的 需求 。 因 此 ， 应 当 将 数据 挖掘 技术 应 用 于 证 券 客户 资料 中 ， 发 现 隐 藏 其 中 的 规 
律 ， 建 立 符合 实际 情况 的 客户 等 级 体系 模型 。 客 户 等 级 体系 模型 建立 的 过 程 如 图 4.4 所 示 。 
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图 4.3 客户 细 分 的 DFM 模型 


客户 产品 信息 库 


数据 进行 清洗 和 集成 
离散 每 个 属性 ， 并 


根据 每 个 属性 的 重 
要 性 来 确定 每 个 属 


性 的 取 值 


图 4.4 客户 等 级 体系 模型 建立 过 程 


评定 客户 的 等 级 ， 必 须 先 获得 客户 的 基本 信息 情况 ， 如 性 别 、 年 龄 、 收 入 状况 、 信 用 
状况 、 投 资 偏好 、 风 险 偏好 等 多 个 项 目 ， 其 后 经 过 数据 清洗 和 集成 ， 经 过 数据 转换 ， 最 终 
得 到 基本 的 客户 信息 数据 表 ( 见 表 4.3)。 


表 4.3 客户 基本 信息 数据 表 


性 别 投资 风格 
年 龄 风险 偏好 
婚姻 状况 投资 广度 
最 高 学 历 证 券 账 户 资产 
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续 表 
职业 资产 周转 率 
行业 仓位 
财产 收入 醒 利率 
总 资产 (区 间 ) 交易 活跃 度 


一 般 情况 下 ， 证 券 公司 会 以 客户 证 券 账 户 资产 以 及 交易 活跃 度 作 为 评定 客户 等 级 的 主 
要 标准 ， 对 不 同等 级 的 客户 其 服务 策略 也 不 同 ( 见 表 4.4)。 


客户 细 分 类 型 


表 4.4 客户 细 分 及 其 服务 策略 


交易 行为 特征 


服务 策略 


类 型 一 : 主要 客户 


类 型 二 ， 睡眠 客户 


类 型 三 ;优质 客户 


类 型 四 :潜力 客户 


2) 


资产 总 量 不 大 ， 有 一 定量 的 买卖 交易 
和 资金 存 取 ; 无 专业 知识 ， 投 机 性 较 
强 ; 数量 较 多 ， 大 多 数 为 中 小 散户 ， 
佣金 贡献 成 交 量 大 

资产 总 量 很 少 ， 基 本 不 进行 股票 交 
易 ， 也 不 存 取 资 金 ， 有 少量 的 收益 ; 
数量 不 多 

资产 总 量 大 ， 交 易 操 作 频繁 ， 有 专业 
的 投资 知识 ， 对 市 场 非常 敏感 ， 有 较 
高 的 盔 利 能 力 ， 是 公司 利润 的 主要 贡 
献 者 

有 一 定 的 资产 量 ， 交 易 操作 次 数 少 ， 
现金 存 取 频 率 低 ; 收入 稳定 ， 投 资 汇 
道 少 ， 对 市 场 不 敏感 ， 弹 亏 不 大 ; 对 
公司 的 佣金 贡献 量 不 大 


证 券 客 户 价值 分 类 模型 
国内 证 券 公 司 在 客户 分 类 方面 方法 较为 简单 ， 并 不 能 很 好 根据 客户 的 需求 和 特点 划分 
客户 群 。 国 外 的 证 券 公司 采用 的 是 SOM(Self Organizing Map) 聚 类 分 析 方 法 对 客户 价值 进 


行 细 分 。 这 种 方法 值得 借鉴 。 


客户 价值 是 指 企业 在 与 客户 的 交往 过 程 中 ， 从 客户 那里 获得 的 客户 总 价值 与 企业 支付 
的 总 成 本 的 差额 。 国 内 证 券 公司 目前 主要 应 用 客户 的 资产 、 交 易 量 、 


提供 大 众 性 咨询 服务 (如 开办 讲座 
等 )， 提 高 其 投资 能 力 


不 必 对 该 类 客户 进行 关注 ， 尽 可 能 地 
减少 该 类 客户 数量 


应 经 常 与 客户 沟通 ， 及 时 发 现 客户 的 
真正 需求 ， 保 持 客 户 的 满意 度 与 忠 
诚 度 


可 以 推荐 一 些 信托 产品 或 者 代 客 理 
财 ， 或 者 提供 投资 咨询 服务 ， 改 变 其 
投资 观念 ， 将 其 发 展 成 为 优质 客户 


贡献 度 等 统计 信息 进 


行 客 户 价值 细 分 。 从 客户 价值 上 把 客户 细 分 为 : 高 利润 客户 、 次 级 利润 客户 、 低 或 无 利润 


客户 。 


SOM 神经 网 络 是 较为 广泛 应 用 于 聚 类 的 神经 网 络 ， 它 是 一 种 无 监督 学 习 的 神经 元 网 络 


模型 。SOM 网 络 可 以 采 月 
而 进行 映射 分 布 和 类 别处 
莉 混 杂 的 、 非 线性 分 布 的 类 型 识别 


问题 是 非常 有 效 的 。 


目 各 神经 元 之 间 的 自动 组 织 去 寻找 各 类 型 间 固 有 的 内 在 的 特征 ， 从 
分 。 所 以 神经 网 络 对 于 解决 各 类 别 特征 不 明显 、 特 征 参数 相互 交 
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在 CRM 系统 中 应 用 客户 价值 分 类 模型 主要 分 为 以 下 几 个 阶段 :收集 证 券 客户 数据 、 
数据 预 处 理 、 客 户 聚 类 、 模 型 评估 、 证 券 客 户 基于 客户 价值 的 分 类 ， 如 图 4.5 所 示 。 


| sw |= 一 一 > 


证 券 客户 基于 客户 价值 的 分 类 


4.5 基于 SOM 聚 类 分 析 的 证 券 客 户 分 类 流程 


4.2.2 客户 满意 度 


客户 满意 度 (Customer Satisfaction Research，CSR)， 是 指 客户 的 期 望 值 与 客户 实际 体验 
的 匹配 程度 ， 换 名 话说， 就 是 客户 通过 对 一 种 产品 或 服务 可 感知 的 效果 与 其 期 望 值 相 比 较 
后 得 出 的 指数 。 

客户 是 企业 的 核心 资源 ， 如 何 让 客户 满意 证 券 公司 提供 的 服务 或 产品 成 为 证 券 客 户 关 
系 管理 的 一 个 十 分 重要 的 分 析 方 面 。 证 券 公司 有 必要 设计 客户 满意 度 评价 指标 体系 从 而 对 
客户 满意 度 进行 研究 ， 同 时 为 挖掘 潜在 客户 、 提 高 客户 价值 、 提 高 客户 的 满意 度 提 供 技术 
上 的 支持 。 因 此 ， 对 证 券 公 司 来 说 ， 构 建 客户 满意 度 模型 十 分 重要 。 

1. 客户 满意 度 关 系 模型 假设 


第 一 ， 假 设 证 券 客 户 满意 度 是 由 客户 对 实际 感知 的 服务 和 期 望 服 务 质量 之 间 的 差额 决 
定 的 。 

第 二 ， 证 券 客 户 的 满意 度 是 客户 对 服务 价值 的 一 种 评估 。 

第 三 ， 证 券 客 户 总 的 满意 度 主 要 受 客户 对 证 券 公司 的 服务 或 产品 的 评价 影响 。 

第 四 ， 客 户 对 各 个 服务 或 产品 的 评价 之 间 是 相互 独立 的 。 

2. 证 券 客户 满意 度 关系 模型 的 建立 


根据 以 上 4 个 假设 ， 再 加 上 给 定 的 客户 满意 度 评价 指标 ， 并 结合 证 券 公司 管理 的 特 
点 ， 分 析 影 响 证 券 客户 满意 度 的 因素 ， 构 建 证 券 客 户 满意 度 关系 模型 ( 见 图 4.6)。 
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集合 理财 产品 风险 性 


投资 顾问 团队 水 平 ” 】 


4.6 ”客户 满意 度 评价 体系 


3. 客户 满意 度 衡量 与 分 析 

客户 的 满意 度 的 提升 或 下 降 是 由 客户 实际 感受 到 的 服务 质量 与 客户 预期 的 服务 质量 之 
间 的 比较 决定 的 。 

用 函数 关系 来 表示 : 客户 满意 度 = (客户 期 望 值 E， 实 际 获取 值 4) 

即 : 客户 满意 度 = 客户 实际 获取 服务 质量 数值 /客户 期 望 服务 质量 数值 = 4/E 

客户 满意 度 由 此 也 可 以 划分 为 4 种 情况 : 客户 满意 度 >1、 客 户 满意 度 =1、 客 户 满意 度 
<1、 客 户 满意 度 <0( 见 表 4.5)。 如 图 4.7 所 示 为 证 券 客户 满意 关系 模型 图 。 


感知 服务 /产品 质量 


实际 的 感受 的 
服务 质量 (A) 


客户 忠诚 度 提 升 客户 忠诚 度 下 降 


图 4.7 证 券 客户 满意 关系 模型 
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表 4.5 证 券 客户 满 意 度 测评 表 以 及 对 应 策略 


评分 采取 对 应 策略 
a 继续 挖掘 客户 期 望 ， 提 供 优质 的 个 性 化 服 
意 度 >1 
有 务 或 产品 
客户 满意 度 -1 加 深 客户 服务 或 产品 ， 防 止 客户 流失 
提高 服务 和 产品 基本 成 分 的 可 靠 性 ， 尽 可 

满意 度 <1 :满意 “容易 转 户 

客户 满意 度 < 客户 容易 转 户 | 1 地 大 必 汪 户 这 

客户 满意 度 <0 客户 转 户 销 户 | 一 


从 证 券 公司 角度 看 ， 要 增加 客户 的 满意 度 ， 有 以 下 几 个 途径 。 

(1) 降低 客户 的 期 望 值 。 

(2) 提升 客户 的 实际 获取 值 。 

对 此 ， 证 券 公司 应 该 采取 以 下 措施 。 

1) ”降低 客户 期 望 值 

降低 客户 期 望 值 是 比较 困难 的 ， 尤 其 在 证 券 业 中 ， 客 户 的 需求 是 多 样 的 ， 因 此 ， 导 致 
客户 的 期 望 也 是 多 种 多 样 的 。 那 么 ， 证 券 公司 应 该 充分 利用 客户 期 望 值 的 脆弱 性 来 降低 其 
期 望 值 。 比 如 证 券 客 户 对 于 以 往 的 投资 经 验 或 习惯 刚 建立 起 来 的 期 望 值 通常 是 非常 不 稳定 
的 ， 只 要 稍微 受到 市 场 波动 就 会 产生 动摇 ， 这 时 候 就 应 该 抓 住 机 会 ， 通 过 公司 专业 的 投资 
顾问 团队 提供 给 客户 其 他 的 期 望 值 ， 送 样 就 可 以 降低 客户 的 期 望 值 。 

2) “提升 公司 的 服务 水 平和 产品 质量 

提高 客户 实际 获取 值 是 企业 通常 的 做 法 ， 证 券 公司 也 不 例外 。 通 过 证 券 公 司 分 类 模型 
把 客户 进行 细 分 ， 分 成 高 价值 客户 、 中 价值 客户 、 低 价值 客户 ， 随 后 根据 不 同 的 客户 提供 
不 同 的 服务 或 产品 ， 最 终 客户 产生 满意 的 感觉 。 


4.2.3 ”流失 客户 预测 


当下 证 券 行业 竞争 十 分 激烈 ， 券 商 之 间 存 在 严重 相互 抢夺 客户 、 客 户 流 失 的 现象 。 客 
户 是 企业 的 核心 资源 ， 衡 量 一 个 证 券 公司 的 成 功 关 键 在 于 客户 ， 客 户 的 投资 收益 、 客 户 份 
额 等 都 与 证 券 公司 利润 密切 相关 。 据 推 第， 挖掘 一 个 潜在 客户 并 最 终 使 他 成 为 正式 客户 是 
留 住 老 客户 成 本 的 6 一 7 倍 。 通 过 创建 客户 流失 模型 进行 预测 ， 可 以 使 证 券 公 司 做 出 相应 
的 预防 措施 ， 从 而 避免 客户 流失 抑或 使 客户 流失 最 小 化 。 

1. 证 券 公司 客户 流失 的 原因 

证 券 公司 客户 流失 的 原因 是 多 方面 的 ， 可 以 分 为 以 下 几 类 。 

1) 然 流 失 

客户 自然 流失 是 因为 营业 部 的 搬迁 、 撤 销 等 。 这 种 情况 是 不 可 避免 的 ， 这 种 客户 流失 
是 在 证 券 公 司 可 承受 范围 之 内 的 ， 不 具有 持续 性 。 

2) ”竞争 流失 

竞争 流失 就 是 因为 各 个 证 券 公司 之 间 的 竞争 导致 的 客户 的 流失 。 
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例如 ， 其 他 券商 在 佣金 上 具有 优势 ， 投 资 顾问 团体 投资 咨询 水 平 更 高 等 。 这 些 因素 都 
可 能 导致 客户 流失 。 

3) 过失 流失 

过 失 流失 是 由 于 客户 对 证 券 公司 的 服务 质量 产生 不 满意 而 造成 的 。 例 如 ， 客 户 经 理 服 
务 态 度 不 好 ， 不 能 满足 客户 正当 需求 等 。 


2. 客户 流失 建 模 的 原则 

客户 选择 哪 家 证 券 公司 ， 选 择 购买 哪 种 金融 产品 和 服务 ， 客 户 的 诸如 此 类 的 选择 会 受 
到 各 方面 因素 的 影响 。 从 微观 角度 来 说 ， 与 人 情 关 系 、 价 格 、 服 务 质量 、 竞 争 对 手 的 策略 
有 关 ; 从 宏观 角度 来 说 ， 国 家 政策 、 国 际 形势 的 变化 都 会 对 客户 流失 与 否 造 成 一 定 的 影 
响 。 在 这 种 情况 下 ， 要 非常 精确 地 预测 某 个 客户 的 流失 是 无 法 做 到 的 。 但 是 ， 大 多 数 情况 
下 客户 的 行为 是 理性 的 ， 他 们 不 会 随意 离开 目前 的 证 券 公司 ， 并 且 客 户 流失 之 前 都 会 有 一 
些 相似 的 行为 特征 ， 这 就 使 预测 客户 流失 的 做 法 成 为 可 能 。 

3. 客户 流失 预测 模型 的 建立 


客户 流失 对 于 证 券 公司 是 一 个 非常 严峻 的 问题 。 证 券 客户 流失 不 仅仅 是 指 客户 销 户 情 
况 ， 也 是 指 客户 把 大 量 资金 转 出 证 券 公司 购买 其 他 金融 机 构 的 理财 产品 或 信贷 产品 等 。 因 
为 面 对 投资 趋 于 多 样 化 ， 证 券 市 场 持续 低迷 ， 导 致 客户 投资 股票 的 意愿 大 幅 降 低 。 然 而 ， 
证 券 公司 应 用 数据 挖掘 技术 进行 证 券 客户 流失 分 析 具 有 十 分 重要 的 意义 。 建 立 证 券 公司 客 
户 流失 预测 模型 ， 可 以 了 解 到 哪些 客户 会 流失 ， 客 户 最 近 有 哪些 异常 行为 ， 还 可 以 分 析 客 
户 流失 的 原因 。 通 过 这 些 现象 的 分 析 ， 证 券 公司 就 能 在 客户 流失 前 采取 相应 措施 。 因 此 ， 
创建 客户 流失 预测 模型 具有 重要 的 现实 意义 。 

建立 客户 流失 模型 预测 的 具体 流程 如 下 。 

1) ”确定 业务 问题 与 环境 评估 

将 客户 流失 分 为 自然 流失 、 竞 争 流失 、 过 失 流失 3 类 。 

2) ”数据 收集 与 处 理 

为 了 建立 损失 客户 预测 模型 ， 必 须 寻 找 大 量 的 原始 数据 ， 然 后 对 数据 进行 简单 的 处 
理 ， 随 后 再 将 数据 转换 成 模型 。 

在 建 模 时 ， 要 根据 数据 的 特征 并 对 数据 进行 分 析 以 寻找 出 不 同 数据 之 间 的 关联 度 ， 寻 
找 出 哪些 变量 与 客户 流失 有 关 ， 哪 些 与 客户 流失 无 关 。 从 而 排除 无 用 数据 ， 降 低 模型 的 复 
杂 性 ， 使 模型 预测 更 加 精确 。 

3) ”数据 应 用 和 评估 

在 损失 客户 预测 模型 建立 后 ， 需 要 大 量 数据 进行 反复 检验 。 如 果 数 据 检验 与 预 估 数值 
相同 就 可 以 立即 运用 到 当前 业务 中 。 通 过 模型 预测 客户 流失 的 趋势 采取 相应 措施 ; 反之， 
如 果 预 估 数 值 存在 很 大 偏差 就 构建 新 的 模型 ， 如 图 4.8 所 示 。 
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构建 流失 预测 模型 
计算 客户 流失 情况 


实际 客户 NO 
流失 情况 
YES 
确定 预测 模型 


图 4.8 损失 客户 预测 流程 


4. 客户 流失 的 Logit 模型 

一 般 地 ， 损 失 客 户 预测 模型 是 通过 客户 数据 资料 的 分 析 和 研究 建立 Logit 回归 模型 。 
利用 此 模型 发 现 客户 的 异常 行为 ， 提 前 做 出 相应 措施 ， 防 止 客户 流失 。 

1) ”变量 选择 

建立 具体 的 客户 流失 预测 模型 的 关键 是 恰当 地 选择 影响 客户 流失 的 变量 ， 即 建 模 
影响 证 券 公 司 客户 流失 的 主要 变量 有 : 证 券 客户 资产 、 集 合理 财产 品 、 异 常 大 额 交 
易 、 异 常 银 证 转账 、 客 户 投 诉 情况 等 。 

2) ”通过 交叉 表 来 判别 显著 影响 变量 

通过 运用 SPSS 等 工具 对 上 述 变量 进行 研究 分 析 。 交 又 表 分 析 结 构 主 要 有 3 个 指标 ， 
“流失 百分比 ”“ 全 部 百分比 ”“ 比 率 值 ”( 见 表 4.6) 


表 4.6 各 属性 识别 流失 客户 的 情况 


流失 百分比 


3) ”建立 Logit 模型 
假设 个 体 选择 方案 天 1( 客 户 不 流失 ) 的 概率 为 P， 则 关 2( 客 户 流失 ) 的 概率 为 1-P， 记 为 
Q。 那 么 P、92 与 影响 因素 之 间 的 关系 用 以 下 模型 表示 : 
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P=e /lt+e 
全 三 了 1 人 
z=B+BE++BY, 


osi(p) -=n[B]-2=B+AX tt 


其 中 ， 所 是 与 各 因素 无 关 的 常数 项 ， 忆 、p,…p, 是 回归 系数 。Logit 分 析 法 可 以 考察 
多 个 变量 对 证 券 客户 流失 的 影响 ， 能 够 通过 对 每 一 个 属性 变量 进行 分 析 研 究 以 考察 它们 的 
贡献 程度 ， 然 后 淘汰 一 些 不 重要 的 变量 ， 最 终 选 择 贡献 度 最 大 的 属性 变量 进行 Logit 回归 
分 析 。 

证 券 公 司 能 够 识别 将 要 流失 的 客户 意味 着 能 够 减少 维护 客户 的 成 本 ， 这 意味 着 增强 客 
户 与 公司 之 间 的 关系 。 此 外 ， 证 券 公 司 还 应 该 注意 到 随 着 证 券 新 业务 的 发 展 ， 在 根据 原 有 
的 数据 库 信 息 构建 和 推导 的 客户 流失 预测 模型 的 效果 可 能 随 着 时 间 的 变化 而 逐渐 衰退 ， 模 
型 需要 不 断 地 更 新 和 改进 。 从 客户 管理 角度 来 说 ， 维 护 和 正确 使 用 数据 库 是 十 分 重要 的 。 


(OD 投资 情 绪 分 析 


在 实践 中 ， 投 资 者 的 非 理 性 行为 在 一 定 程度 上 会 影响 金融 市 场 (例如 2015 年 中 国 中 车 
的 大 起 大 落 )。 在 理论 上 投资 者 是 否 理性 是 传统 金融 学 和 行为 金融 学 的 分 水 岭 。 传 统 金融 理 
论 认为 投资 者 是 理性 的 ， 并 没有 考虑 到 投资 者 的 情绪 因素 ， 而 行为 金融 理论 认为 投资 者 易 
受到 情绪 、 情 感 等 因素 的 影响 ， 并 将 投资 者 情绪 作为 其 两 大 基本 假设 之 一 。 

投资 者 情绪 是 一 个 模糊 和 非 数量 化 的 概念 。 从 广义 上 看 ， 投 资 者 情绪 包含 诸多 能 够 影 
响 投资 者 的 证 券 估 值 和 市 场 预期 的 因素 ， 从 狭义 上 看 ， 投 资 者 情绪 仅 研究 对 投资 者 的 证 券 
估 值 和 市 场 预期 能 够 产生 影响 的 经 济 变量 和 其 他 因素 。 对 于 证 券 经 营 机 构 与 相关 研究 机 构 
来 说 ， 投 资 者 情绪 的 测量 是 一 个 难题 。 如 何 对 投资 者 情绪 进行 量化 分 析 ， 这 对 股票 市 场 研 
究 来 说 至 关 重 要 。 


4.3.1 投资 者 情绪 的 测量 


关于 投资 者 情绪 指标 ， 根 据 指标 数据 的 主客 观 性 和 数据 来 源 可 以 分 为 两 类 : 主观 测量 
指标 和 客观 测量 指标 。 近 年 来 ， 对 于 投资 者 情绪 的 测量 出 现 了 新 的 趋势 ， 学 者 们 针对 主观 
测量 指标 和 客观 测量 指标 的 不 足 ， 在 其 基础 上 加 以 改良 ， 构 造 了 复合 投资 者 情绪 指标 作为 
投资 者 情绪 的 代理 变量 。 下 面 分 别 加 以 介绍 。 

1. 主观 投资 者 情绪 指标 

主观 投资 者 情绪 指标 也 称 为 直接 指标 ， 是 指 经 过 调查 得 到 的 直接 反映 投资 者 对 市 场 行 
情 的 看 法 和 判断 ， 一 般 以 投资 者 看 涨 、 看 跌 及 看 平 的 比率 数据 来 表示 出 来 ， 或 是 用 经 济 信 
心 指数 进行 蔡 代 ， 直 观 地 表现 出 投资 者 对 未 来 市 场 的 悲观 或 乐观 情绪 。 例 如 : 美国 证 券 市 
场 的 友好 指数 、 个 人 投资 者 协会 指数 (AAI 指数 )、 投 资 者 智慧 指数 (I 指数 ) 等 。 由 于 国内 
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尚 无 与 投资 者 情绪 调查 有 关 的 标准 化 组 织 ， 国 内 一 些 机 构 编制 出 的 投资 者 情绪 调查 指标 尚 
缺乏 权威 性 。 在 研究 中 少 有 学 者 运用 主观 指标 来 度量 中 国 投资 者 情绪 。 就 目前 而 言 ， 具 有 
一 定 影响 力 和 认同 度 的 主观 指标 主要 有 央视 看 盘 指数 、 消 费 者 信心 指数 、 巨 潮 投资 者 信心 
指数 以 及 耶鲁 -CCER 投资 者 信心 指数 

1) ”国外 常见 的 投资 者 情绪 指标 

(1) AAII 指数 。 

AAII 指数 ， 即 美国 个 人 投资 者 协会 指数 ， 它 是 由 美国 个 人 投资 者 协会 自 1987 年 调查 
发 布 的 指数 。AAII 指数 每 周 通过 随机 抽样 向 其 会 员 发 出 调查 问卷 ， 并 于 周 四 记录 当 周 收回 
的 问卷 。 调 查 的 内 容 是 要 求 参与 者 对 未 来 6 个 月 的 股市 进行 预测 : 看 涨 、 看 跌 或 者 看 平 。 
由 于 调查 主要 针对 个 人 ， 所 以 该 指标 一 般 用 以 衡量 个 人 投资 者 情绪 ， 也 是 国外 学 术 界 常用 
的 投资 者 情绪 指标 之 一 。 

(2) 工 指数 。 

I 指数 ， 即 投资 者 智慧 指数 ， 它 是 由 Chartcraft 公司 编制 的 一 个 对 超过 150 家 报纸 股 
评 人 士 情 绪 的 调查 数据 。 它 的 具体 公式 为 : 看 多 比例 与 看 空 比 例 之 差 。 由 于 股评 的 作者 大 
多 都 是 现任 的 或 者 是 已 经 退休 的 金融 专业 人 士 ， 他 们 具有 一 定 的 专业 性 ， 因 此 II 指数 被 视 
作 中 型 投资 者 的 情绪 的 代表 。 

(3) 友好 指数 。 

友好 指数 是 美国 哈达 迪 (HADADY) 公 司 的 产品 ， 于 每 周一 在 美国 证 券 交易 所 闭 市 后 公 
布 。 该 公司 统计 全 国 主要 报刊 、 基 金 公司 、 投 资 机 构 等 每 周 的 买 进 卖 出 建议 ， 然 后 通过 打 
分 评估 它们 的 乐观 程度 。 

2) 国内 常见 的 投资 者 情绪 指标 

(1) 央视 看 盘 指 数 。 

央视 看 盘 指 数 由 中 央 电 视 财经 频道 编制 ， 通 过 向 知名 的 机 构 投资 者 和 普通 个 人 投资 者 
发 放 调查 问卷 ， 收 集 其 对 后 市 的 看 法 编制 而 成 。 问 卷 中 将 投资 者 对 市 场 的 预测 分 成 看 涨 、 
看 平和 看 跌 3 类 ， 调 查分 为 日 调查 和 周 调查 两 种 。 

(2) 消费 者 信心 指数 。 

主观 指标 中 有 一 类 是 使 用 其 他 经 济 信心 指数 来 蔡 代 ， 我 国 的 消费 者 信心 指数 也 常用 于 
作为 投资 者 情绪 的 代理 变量 。 消 费 者 信心 指数 由 国家 统计 局 编制 ， 用 以 衡量 社会 公众 对 目 
前 及 未 来 经 济 的 信心 程度 ， 在 一 定 程 度 上 能 反映 投资 者 情绪 。 

(3) 巨 潮 投资 者 信心 指数 。 

2003 年 ， 深 圳 证 券 信息 公司 借鉴 国外 已 有 的 投资 者 信心 指数 及 国家 统计 局 的 消费 者 信 
心 指 数 的 编制 方法 ， 推 出 了 巨 潮 投资 者 信心 指数 ， 它 由 一 组 动态 的 量化 指标 构成 ， 刻 画 了 
投资 者 对 目前 及 未 来 市 场 的 信心 状态 ， 各 指标 数据 均 由 每 周一 次 的 问卷 调查 获得 。 


2. 客观 情绪 测量 指标 


客观 指标 也 称 为 间接 指标 ， 这 类 指标 主要 是 采集 金融 市 场 上 与 投资 者 情绪 相关 的 公开 
交易 数据 或 通过 相关 的 统计 方法 来 构造 相应 的 情绪 指标 来 衡量 投资 者 情绪 的 变化 。 相 对 于 
主观 指标 而 言 ， 客 观 指标 在 学 术 研究 中 应 用 更 为 广泛 。 早 在 20 世纪 80 年 代 ， 西 方 学 者 已 
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开始 收集 证 券 市 场 上 与 投资 者 情绪 有 关 的 数据 ， 并 对 这 些 数 据 进行 处 理 并 构造 相应 的 情绪 
指标 ， 作 为 投资 者 情绪 的 度量 。 这 些 指标 根据 其 来 源 与 性 质 的 不 同 ， 可 以 大 致 分 为 以 下 
四 大 类 。 

1) 市场 表现 类 

市 场 表 现 类 包括 : 腾 落 指数 、 新 高 新 低 指标 、 首 日 IPO 表现 (包括 IPO 发 行 数 量 和 IPO 
首 日 收益 )、 市 场 换 手 率 、 市 场 交易 量 、 市 场 流动 性 水 平 。 腾 落 指 数 是 以 股票 每 天 上 涨 或 下 
跌 的 家 数 作为 观察 与 计算 的 对 象 ， 以 了 解 股市 人 气 的 盛衰 ， 研 判 大 盘 的 走势 。 新 高 新 低 指 
标 是 计算 市 场 上 的 股票 创 一 年 来 新 高 或 新 低 的 家 数 ， 以 此 反映 市 场 的 强 弱 程度 。IPO 市 场 
相关 指标 包括 了 IPO 发 行 数量 和 IPO 首 日 溢价 。 一 般 认 为 一 段 时 间 内 IPO 发 行 数量 越 大 ， 
首 日 IPO 溢价 越 高 ， 投 资 者 情绪 越 乐观 。 市 场 交易 量 和 市 场 换 手 率 指 标 也 都 是 常见 的 客观 
投资 者 情绪 测量 指标 ， 市 场 交 易 量 越 大 ， 换 手 率 越 高 ， 市 场 中 的 投资 者 情绪 越 乐 观 。 流 动 
性 水 平 也 常 出 现在 国外 关于 投资 者 情绪 的 研究 中 ， 作 为 投资 者 情绪 的 代理 变量 。 

2) “交易 行为 类 

交易 行为 类 包括 : 保证 金 借 款 比例 、 短 期 利率 变化 比例 、 卖 空 比例 、 零 股 卖 空 比例 。 
在 交易 行为 类 指标 中 ， 美 联储 每 月 发 布 的 保证 金 借款 比例 常 被 认为 是 牛市 指示 器 ， 保 证 金 
借款 比例 越 高 ， 市 场 中 投资 者 情绪 越 乐观 。 短 期 利率 的 变化 常 被 看 作 是 熊市 指示 器 。 卖 空 
比例 是 卖 空 交易 额 占 总 的 卖 出 交易 额 的 比重 ， 卖 空 比 例 越 高 ， 投 资 者 情绪 越 悲观 。 零 股 卖 
空 比例 是 代表 着 不 足 100 股 的 买卖 交易 占 总 交易 额 的 比例 ， 零 股 卖 空 比 例 更 多 地 反映 的 是 
个 人 投资 者 情绪 ， 零 股 买卖 比例 越 高 ， 投 资 者 情绪 越 悲 观 。 

3) ”衍生 变量 

衍生 变量 包括 : 认 沽 认购 比 、 波 动 率 指数 VIX。 认 沽 认购 比 代 表 着 卖 出 / 买 入 期 权 的 交 
易 量 之 比 ， 该 比例 越 高 ， 代 表 着 投资 者 情绪 越 悲观 ， 常 作为 熊市 指示 器 。 波 动 率 指数 VIX 
又 称 为 “恐慌 指数 ”， 用 以 反映 S & P500 指数 期 货 的 波动 程度 。 

4) ”其 他 情绪 代理 

除 以 上 3 类 指标 外 ， 还 有 一 些 能 反映 投资 者 情绪 的 客观 指标 ， 包 括 封 闭 基 金 折价 率 、 
共同 基金 净 买 入 、 红 利 溢价 、 新 增 投资 者 开户 数 、 股 票 发 行 /债券 发 行 比 例 、 季 节 性 情绪 变 
化 SAD 等 。 

证 券 经 营 机 构 和 研究 机 构 可 以 根据 上 述 投资 者 情绪 指标 ， 以 SPSS 统计 软件 为 工具 ， 
建立 一 个 关于 投资 者 情绪 指标 与 股票 市 场 价 格 之 间 关 系 的 模型 ， 从 而 为 投 融 资 服务 客户 提 
供 一 定 的 参考 。 


4.3.2 ”基于 网 络 熏 情 的 投资 者 情绪 分 析 


1. 网 络 与 情 与 投资 者 情绪 


投资 者 情绪 除了 表现 在 上 述 已 经 被 量化 的 指标 上 外 ， 还 会 在 网 络 与 情 中 体现 。 随 着 互 
联网 的 普及 ， 以 微 博 、 论 坛 、 博 客 等 为 代表 的 网 络 社交 媒体 广泛 流行 ， 网 络 与 情 逐 渐 成 为 
影响 人 们 情绪 、 态 度 行为 的 重要 因素 。 

网 络 与 情 (Network Public Opinion)， 是 指 在 互联 网 上 流行 的 对 社会 问题 不 同 看 法 的 网 
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络 与 论 ， 是 社会 与 论 的 一 种 表现 形式 ， 是 通过 互联 网 传播 的 公众 对 现实 生活 中 某 些 热 点 、 
焦点 问题 所 持 的 有 较 强 影响 力 、 倾 向 性 的 言论 和 观点 。 它 具有 以 下 几 种 特征 。 

1) 直接 性 

直接 性 是 指 网 民 可 以 通过 微 博 、 论 坛 和 博客 随时 发 表意 见 ， 民 意 表达 十 分 畅通 ;网 络 
与 论 具有 无 限 次 即时 快速 传播 的 可 能 性 ， 网 民 可 以 转发 将 信息 重新 传播 ， 一 个 爆炸 性 的 新 
闻 信 息 能 在 很 短 的 时 间 被 大 多 数 网 民 获 取 。 

2) ”虚拟 性 

互联 网 由 于 是 一 个 虚拟 的 空间 ， 发 言 者 的 身份 是 隐蔽 的 ， 再 加 上 我 国 对 网 络 与 情 的 管 
理 和 监督 不 够 完善 ， 因 此 网 络 舆 情 的 真实 性 是 值得 推敲 的 。 有 的 信息 可 能 是 网 民 片面 、 错 
误 的 认识 ， 有 的 信息 可 能 是 网 民 宣泄 情绪 所 捏造 的 ， 有 的 信息 也 可 能 是 出 于 商业 目的 甚至 
是 不 法 目的 杜撰 的 。 因 此 ， 网 络 与 情 具 有 一 定 的 虚拟 性 。 

3) ” 突 发 性 
网 络 和 与 情 的 形成 往往 非常 迅速 ， 一 个 新 闻 热点 再 加 上 一 个 情绪 化 的 观点 就 可 以 掀起 一 
大 片 与 论 的 波浪 。 

4) ”随意 性 和 多 元 性 

网 络 熏 情 不 同 于 传统 媒体 的 一 点 是 网 络 与 情 对 个 人 来 说 是 没有 门槛 的 ， 所 有 人 都 可 以 
通过 网 络 媒体 发 表意 见 和 评论 。 网 民 在 网 上 或 隐匿 身份 、 或 现身说法 ， 谈 论 国事 、 交 流 思 
想 。 网 络 为 民众 提供 交流 的 空间 ， 也 为 搜集 真实 的 与 情 提供 了 素材 。 

在 金融 领域 ， 越 来 越 多 的 投资 者 会 在 网 络 中 表达 自己 的 投资 情绪 ， 同 时 投资 者 的 投资 
决策 会 受到 网 络 与 情 的 影响 。 网 络 与 情 中 的 投资 者 情绪 对 证 券 经 营 机 构 来 说 具有 极 高 的 研 
究 价值 。 原 因 如 下 。 

首先 ， 投 资 者 情绪 会 对 股票 价格 产生 系统 性 影响 。 当 投资 者 情绪 好 的 时 候 ， 投 资 者 倾 
向 于 采用 简单 启发 式 来 辅助 决策 ， 并 在 信息 处 理 中 较 少 采取 批评 的 模式 ， 而 在 情绪 不 好 的 
时 候 ， 投 资 者 更 倾向 于 采用 更 加 周密 的 分 析 活动 ， 但 是 投资 者 通常 会 将 自身 的 情趣 归咎 于 
错误 的 来 源 而 产生 错误 的 判断 。 投 资 者 的 个 体 情绪 变化 可 以 通过 网 络 媒体 在 群体 中 蔓延 传 
染 ， 最 终 会 形成 具有 倾向 性 的 群体 情绪 ， 进 而 对 股票 市 场 价格 产生 影响 。 

其 次 ， 投 资 者 情绪 也 受到 股票 市 场 的 影响 。 投 资 者 决策 时 其 心理 因素 会 随 着 股票 市 场 
的 变化 而 改变 。 例 如 ， 当 股票 市 场 上 充满 着 许多 不 确定 性 的 时 候 ， 投 资 者 会 规避 风险 ， 试 
图 进行 理性 的 投资 ， 然 而 投资 者 会 发 现 自己 的 对 股票 市 场 的 认 知 能 力 有 限 ， 为 了 进行 更 好 
的 投资 决策 投资 者 会 借助 于 媒体 信息 、 专 家 建议 以 及 自身 的 感觉 、 经 验 等 。 股 票 市 场 的 不 
确定 性 越 大 ， 投 资 者 的 这 种 求助 感 越 强烈 ， 人 类 的 认 知 偏差 就 越 可 能 出 现 ， 从 而 导致 投资 
者 的 非 理性 行为 。 

由 此 可 见 ， 投 资 者 情绪 与 股票 市 场 价格 是 相互 改变 、 相 互 影响 的 。 

2. 获取 投资 者 情绪 分 析 的 方法 


应 用 网 络 与 情 分 析 投 资 者 情绪 ， 需 要 从 大 量 文本 信息 或 非 结构 化 数据 中 挖掘 有 价值 的 
资料 。 通 过 网 络 与 情 分 析 投 资 者 情绪 的 过 程 如 图 4.9 所 示 。 
首先 ， 应 用 文本 挖掘 技术 ， 从 杂乱 无 序 的 网 络 媒体 信息 中 获取 有 价值 的 信息 ， 把 非 结 
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构 化 的 文本 信息 转化 为 结构 化 文本 信息 ， 从 文本 信息 中 提取 投资 者 情绪 测评 指标 ， 结 合 属 
性 词典 和 情感 词典 ， 应 用 情感 分 析 引 擎 ， 获 得 投资 者 情绪 分 析 结 果 。 然 后 ， 可 支撑 两 方 本 
的 应 用 : 一 是 基于 投资 者 情绪 分 析 结果 ， 以 及 情绪 与 股票 市 场 之 间 走势 的 关联 。 对 市 场 行 
情 进行 预测 。 二 是 基于 文本 信息 中 的 上 市 公司 属性 和 投资 者 情感 倾向 ， 预 测 各 类 上 市 公司 
的 股票 价格 走势 ， 为 买 入 、 观 望 、 卖 出 等 决策 提供 支撑 。 


待 分 析 句 子 + 关注 度 
属性 词 + 情感 词 + 关注 度 


情感 分 析 引 擎 


投资 者 情绪 分 析 


股票 市 场 预测 


上 市 公司 评价 
情感 倾向 


观望 / 买 入 / 卖 出 


4.9 ”通过 网 络 与 情 分 析 投资 者 情绪 


对 于 网 络 与 情 中 投资 者 情绪 的 分 析 ， 主 要 应 用 网 页 抓 取 技术 、 特 征 挖 掘 技术 以 及 情感 
极 性 分 类 技术 等 。 

1) ”网 页 抓 取 技术 

网 络 息 虫 是 目前 使 用 最 多 的 文本 采集 技术 。 网 络 息 虫 又 称 为 网 络 蜂 蛛 ， 是 一 个 自动 抓 
取 网 页 的 计算 机 程序 ， 作 为 搜索 引擎 的 重要 组 成 部 分 来 使 用 ， 为 搜索 引擎 从 互联 网 下 载 网 
页 。 通 用 网 络 爬 虫 的 原理 如 下 : 从 一 个 或 若干 初始 网 页 的 URL 开始 ， 获 得 初始 网 页 上 的 
URL 列表 ， 在 抓 取 过 程 中 ， 不 断 地 从 当前 页 面 上 抽取 新 的 URL 放 入 队列 ， 直 到 URL 的 队 
列 为 空 或 满足 某 个 疏 行 终止 条 件 。 主 体 爬 虫 的 工作 流程 较 通用 网 络 爬 虫 复 杂 ， 需 要 根据 一 
定 的 网 页 分 析 算 法 过 滤 与 主题 无 关 的 链接 ， 保 留 有 用 的 链接 并 将 其 放 入 等 待 抓 取 的 URL 
队列 中 。 然 后 ， 根 据 一 定 的 搜索 策略 从 队列 中 选择 下 一 步 抓 取 的 网 页 URL， 并 重复 上 述 过 
程 ， 直 到 满足 系统 设置 的 某 一 停止 条 件 。 有 别 于 传统 网 络 朴 虫 的 是 ， 主 体 爬 虫 主要 解决 3 
个 问题 一 是 对 抓 取 目标 的 描述 或 定义 ， 二 是 对 网 页 或 数据 结构 的 分 析 与 过 滤 ， 三 是 确定 
对 URL 的 搜索 策略 。 这 一 过 程 所 得 到 的 分 析 结 果 还 将 对 以 后 的 抓 取 过 程 提供 反馈 和 
指导 。 

优秀 的 网 络 爬 虫 工具 应 当 具 备 抓 取 速度 快 、 抓 取 准 确 率 高 、 更 新 及 时 、 可 拓展 性 强 、 
具有 分 布 式 抓 取 等 特点 。 目 前 比较 流行 的 抓 取 工具 包括 : Heritk、WebSphinx、MetaSeeke 等 。 

2) ”特征 挖掘 技术 

特征 挖掘 技术 是 一 种 能 够 从 结构 化 的 文本 信息 中 提取 出 关键 属性 词 的 技术 。 属 性 词 一 
般 由 名 词 和 名 词 短语 组 成 。 例 如 ，“ 贵 州 茅台 (600519) 关 于 部 分 监事 辞职 的 公告 ”其 中 
“部 分 监事 辞职 ”就 是 一 个 投资 者 关注 的 属性 词 。 产 品 具有 多 种 属性 ， 也 称 为 产品 特征 。 
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一 般 情 况 下 ， 一 篇 产品 评论 信息 可 能 涉及 产品 的 多 个 特征 。 相 应 地 ， 上 市 公司 也 具有 不 同 
属性 ， 在 股吧 评论 信息 中 涉及 上 市 公司 的 不 同 的 属性 。 例 如 : 产品 、 业 绩 、 利 润 等 。 

产品 特征 可 以 分 为 显 性 特征 和 隐 性 特征 两 类 。 显 性 特征 是 指出 现在 语句 中 可 以 直接 作 
为 产品 特征 的 词汇 或 短语 ， 而 隐 性 特征 是 指 句子 中 没有 明显 的 特征 描述 ， 需 要 对 句子 进行 
语义 理解 后 才能 得 到 的 特征 。 提 取 隐 性 特征 需要 自然 语言 的 完全 理解 技术 ， 而 目前 该 技术 
还 不 够 成 熟 。 因 此 ， 目 前 的 产品 特征 挖掘 只 考虑 显 性 特征 。 在 网 络 与 情 中 也 只 能 识别 上 市 
公司 的 显 性 属性 ， 进 而 判断 投资 者 对 不 同 显 性 属性 的 情感 倾向 。 

特征 挖掘 技术 是 技术 框架 中 的 重要 内 容 ， 目 前 主要 有 两 种 技术 方法 。 第 一 种 是 人 工 定 
义 的 方法 ， 这 也 是 最 常用 的 方法 ， 主 要 有 以 下 几 种 模式 。 

(1) 先 应 用 文本 特征 表示 ， 再 建立 挖掘 模型 ， 类 似 于 文本 关键 词 的 提取 方法 。 

(2) 先 建立 概念 模型 ， 再 根据 评论 信息 中 的 语音 进行 模式 匹配 。 

(3) 建立 领域 知识 模型 ， 比 如 某 些 研究 中 挖掘 出 抽象 属性 就 是 应 用 了 事先 建立 的 领域 
知识 模型 。 

(4) 建立 本 体 模型 ， 这 一 类 研究 和 概念 模型 比较 接近 ， 就 是 事先 建立 了 一 个 关于 产品 
的 相关 概念 及 关系 的 本 体 。 目 前 在 这 一 领域 应 用 得 比较 多 的 英文 词 网 就 相当 于 一 个 通用 的 
语言 本 体 。 

第 二 种 是 自动 提取 的 方法 。 该 类 方法 主要 通过 词性 标注 、 句 法 分 析 、 文 本 模式 等 自然 
语言 处 理 技 术 对 评论 信息 进行 文本 分 析 ， 自 动 发 现 文本 特征 ， 这 种 方法 具有 很 强 的 可 移 
植 性 。 

从 挖掘 效果 上 看 ， 自 动 提取 办 法 的 结果 通常 查 全 率 比较 理想 ， 但 是 查 准 率 与 人 工 定义 
法 仍 有 一 定 差距 。 

3) ”情感 极 性 分 类 技术 

情感 极 性 分 类 主要 是 分 析 主 观 性 文本 、 句 子 或 者 短语 的 襄 义 或 贬义 ， 即 判定 它们 的 极 
性 类 别 。 情 感 极 性 分 类 是 有 指导 的 机 器 自动 分 类 ， 一 般 分 为 训练 和 分 类 两 个 阶段 ， 可 以 分 
为 以 下 几 个 步骤 。 

(1) 确定 情感 分 析 单元 。 情 感 分 析 单 元 即 情感 极 性 的 分 类 对 象 ， 它 是 由 研究 目的 所 决 
定 的 。 情 感 分 析 单 元 选择 是 否 合适 ， 直 接 对 文本 信息 的 情感 分 析 效 果 产 生 较 大 的 影响 。 

情绪 单元 可 以 分 为 词汇 短语 层 、 句 子 层 和 文档 层 3 个 粒度 层面 。 

Q@ 词汇 短语 层 。 它 主要 研究 集中 在 单个 词语 或 短语 的 语义 倾向 性 ， 采 用 的 方法 主要 
包括 基于 语 料 挖掘 的 方法 和 基于 极 性 词典 拓展 的 方法 。 

@@ 句子 层 。 情感 可 以 由 主题 、 意 见 持 有 者 、 情 感 描述 项 和 襄 贬 倾向 性 的 4 个 部 分 来 
描述 ， 即 意见 持 有 者 针对 主题 表达 了 有 具有 某 种 襄 贬 倾向 的 情感 描述 。 语 句 的 情感 分 析 重 点 
是 在 语句 文本 中 自动 确定 这 些 元 素 以 及 它们 之 间 的 关系 的 过 程 。 

@ 文档 层 。 文 档 层 情感 分 析 一 般 首 先 计 算 或 判断 词汇 或 词组 的 训 贬 倾向 性 ， 再 通过 
篇 章 中 极 性 词语 或 词组 技术 或 对 其 误 贬 程度 值 求 和 或 均值 或 结合 句法 分 析 等 获得 句子 或 篇 
章 的 总 体 情感 极 性 。 

(2) 文本 表示 训练 文本 。 文 本 表示 将 决定 选用 什么 样 的 文本 特征 来 表达 文本 信息 。 就 
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目前 的 文本 分 类 系统 来 看 ， 绝 大 多 数 都 是 以 词语 或 者 词语 组 合作 为 特征 项 表达 文本 信 
息 的 。 

(3) 挑选 分 类 方法 并 训练 分 类 模型 。 已 有 的 文本 分 类 方法 可 以 分 为 : 统计 方法 、 机 器 
学 习 方法 等 。 在 对 待 分 类 样本 进行 分 类 前 ， 需 要 确定 分 类 方法 ， 利 用 训练 文本 进行 学 习 训 
练 并 获得 分 类 模型 。 

(4) 运用 分 类 模型 对 测试 集 进行 极 性 分 类 ， 评 价 所 建立 的 分 类 模型 的 分 类 效果 。 

情感 极 性 分 类 算法 可 以 分 为 两 类 ， 即 基于 语义 的 情感 分 类 方法 和 基于 机 器 学 习 的 情感 
分 类 方法 。 

中 ”基于 语义 的 情感 分 类 。 是 指 通过 文本 信息 语义 分 析 的 方式 建立 情感 分 类 器 ， 主 要 
有 两 种 方式 。 第 一 种 是 先 从 情感 单元 中 抽取 带 有 情感 倾向 的 形容 词 或 者 动词 ， 将 其 称 为 情 
感 词 ， 以 及 和 这 些 词 具有 修辞 关系 的 程度 副词 或 否定 副词 ， 然 后 对 这 些 情 感 词 进行 情感 倾 
向 计算 ， 并 得 到 它们 的 情感 倾向 值 ， 最 后 对 情感 词 的 情感 倾向 值 求 和 ， 得 到 情感 分 析 单 元 
的 情感 倾向 值 。 第 二 种 是 建立 一 个 包含 情感 字典 的 情感 倾向 语义 模式 库 ， 然 后 把 情感 倾向 
分 析 单 元 按照 这 个 模式 进行 模式 匹配 ， 计 算出 情感 倾向 值 ， 最 后 对 这 些 短语 模式 的 情感 倾 
向 值 求 和 ， 得 到 该 情感 分 析 单元 的 情感 倾向 值 。 

@ 基于 机 器 学 习 的 情感 分 类 。 主 要 算法 包括 : 朴素 贝 叶 斯 算法 、 决 策 树 、 人 工 神经 
网 络 、K 近邻 算法 等 。 对 常用 文本 分 类 算法 分 析 比 较 发 现 ， 支 持 向 量 机 、K 近邻 算法 、 朴 
素 贝 叶 斯 是 3 种 较 好 的 文本 分 类 算法 ， 其 中 支持 向 量 机 具有 最 高 的 分 类 精度 ， 但 分 类 速度 
最 慢 ， 朴 素 贝 叶 斯 算法 具有 最 高 的 分 类 速度 但 是 精度 最 低 。 

基于 语义 的 情感 分 类 算法 和 基于 机 器 学 习 的 情感 分 类 算法 各 有 利弊 。 基 于 语义 的 极 性 
分 类 算法 能 够 更 加 接近 现实 的 语义 特征 ， 但 分 析 效 果 依赖 于 对 语义 模式 的 正确 归纳 ， 基 于 
机 器 学 习 的 情感 分 类 算法 ， 直 接 明确 提取 文本 信息 情感 特征 项 ， 但 分 析 效 果 依 赖 于 语料库 
或 训练 文本 信息 的 代表 程度 。 

(5) 使 用 获得 的 分 类 模型 对 待 分 类 文本 进行 分 类 ， 并 对 分 类 效果 进行 评价 。 

文本 分 类 中 普遍 使 用 的 性 能 评估 指标 包括 查 准 率 (Precision) 和 查 全 率 (Recall)。 查 准 率 
反映 了 一 个 分 类 器 对 于 类 别 的 区 分 能 力 ， 查 准 率 越 高 ， 表 明 分 类 器 识别 的 正确 分 类 数 与 总 
分 类 数 差距 不 大 ， 即 识别 的 错误 率 较 低 。 查 全 率 反 映 了 一 个 分 类 器 的 泛 化 能 力 ， 查 全 率 越 
高 ， 说 明 这 个 分 类 器 能 够 把 正确 的 类 别 识别 出 来 ， 但 并 不 关心 识别 出 的 总 个 数 。 

为 了 判断 属性 词 所 在 文本 信息 的 情感 极 性 是 否 符合 人 工 标注 的 真实 极 性 ， 可 以 归结 为 
一 个 二 值 分 类 ， 评 估 选 择 使 用 二 维 列 联 表 。 判 断 情感 极 性 的 过 程 中 可 以 通过 列 联 表 进行 展 
示 ， 如 表 4.7 所 示 。 真 正 属于 该 类 的 极 性 数 即 在 人 工 标 注 中 得 到 的 情感 极 数 。 衡 量 查 准 率 
与 查 全 率 的 计算 方法 如 下 : 


Precision = 区 

+B 

Recall= a 
台所 
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表 4.7 评估 极 性 分 类 性 能 的 列 联 表 


情感 极 性 句子 数 非 情感 极 性 句子 数 
控 握 出 来 的 情感 极 性 句子 数 [| 
未 控 气 出 来 的 情感 极 性 句子 数 


如 果 算 法 的 查 准 率 高 而 查 全 率 低 的 话 ， 虽 然 分 类 效果 的 可 靠 性 高 ， 但 对 新 的 语句 进行 
分 类 时 很 多 正确 的 类 别 不 能 识别 。 而 如 果 算 法 的 查 全 率 高 查 准 率 低 的 话 ， 虽 然 对 新 语句 的 
正确 识别 效果 很 好 ， 但 分 类 结果 中 错误 的 数量 可 能 会 比较 多 。 由 此 分 析 ， 单 独 使 用 查 准 率 
和 查 全 率 中 的 一 个 指标 来 评价 分 类 算法 是 不 全 面 的 ， 需 要 综合 考虑 。 


(OD 于 到 大 数据 与 量化 投资 


4.4.1 量化 投资 概述 


量化 投资 (Quantitative Investment)， 是 指 通过 对 金融 市 场 和 产品 信息 进行 量化 分 析 ， 根 
据 历史 交易 和 相关 数据 建立 模型 ， 由 模型 做 出 投资 决定 ， 再 根据 算法 自动 下 单 完成 交易 。 

与 其 相对 应 的 一 个 概念 是 定性 投资 (Traditional Investment)， 它 是 指 通过 研究 市 场 和 人 金 
融 产品 信息 ， 参 考 历 史 和 当前 该 产品 的 交易 价格 ， 根 据 主观 经 验 做 出 投资 决定 ， 进 行 下 单 
交易 。 

量化 投资 和 定性 投资 一 样 ， 也 需要 做 交易 前 分 析 、 下 单 交易 和 交易 后 分 析 等 3 个 方面 
的 工作 。 其 中 的 人 工 工作 包括 建立 数学 模型 、 挖 掘 数据 模式 、 开 发 计算 机 软件 系统 、 设 置 
各 种 参数 ， 在 量化 投资 软件 系统 运行 后 ， 还 要 对 系统 进行 分 析 评 估 ， 然 后 根据 评估 结果 调 
整 模型 或 者 重新 挖掘 数据 模式 ， 使 得 系统 更 加 有 效 。 

当下 在 金融 领域 出 现 多 种 灵活 多 变 的 量化 投资 策略 ， 如 量化 选 股 、 量 化 择 时 、 量 化 套 
利 、 算 法 交易 、 资 产 配 置 等 。 

1) “量化 选 股 

量化 选 股 是 指 通过 数量 分 析 判 断 是 否 应 该 购 入 某 种 股票 。 有 具体 的 方法 主要 包括 公司 估 
值 法 、 趋 势 法 和 资金 法 。Q@ 公 司 估 值 法 是 通过 分 析 公 司 的 基本 面 得 出 公司 股票 的 理论 价 
格 ， 并 通过 与 市 场 价格 做 比较 从 而 确定 投资 策略 。@) 趋 势 法 是 把 市 场 分 为 强 市 、 弱 势 、 盘 
整 3 种 形态 ， 投 资 者 根据 不 同 的 形态 做 出 相应 的 投资 决策 。@ 资 金 法 是 根据 市 场 主力 资金 
的 流动 方向 进行 投资 决策 。 

2) ”量化 择 时 

量化 择 时 是 指 根据 数量 化 的 方法 ， 对 经 济 基本 面 进行 量化 分 析 的 基础 上 ， 参 考 历 史 以 
及 当前 的 市 场 价格 ， 确 定 某 只 股票 合适 的 买 入 时 机 。 具 体 方法 有 趋势 择 时 、 市 场 情 绪 择 
时 、 牛 能 线 、Hurst 指数 等 。 

3) “量化 套利 

量化 套利 是 指 运用 量化 分 析 的 方法 确定 某 种 标的 的 最 优 投资 组 合 ， 并 将 一 种 投资 组 合 
看 成 一 种 金融 产品 进行 量化 研究 。 主 要 包括 股指 期 货 套利 、 商 品 期 货 套利 、 统 计 套 利 、 期 


134 


大 数据 在 证 券 行业 中 的 应 用 轩 第 光 章 


权 套 利 等 。 

4) ”算法 交易 

算法 交易 又 称 自动 交易 、 程 序 交 易 或 者 机 器 交易 ， 它 指 的 是 通过 计算 机 程序 发 出 交易 
指令 。 在 交易 中 ， 程 序 可 以 决定 的 范围 包括 交易 的 时 间 、 交 易 的 价格 等 。 

5) ”资产 配置 

资产 配置 是 指 资 产 类 别 选 择 、 投 资 组 合 中 各 类 资产 的 适当 配置 以 及 对 这 些 混合 资产 进 
行 实时 管理 。 量 化 投资 管理 将 传统 投资 组 合理 论 与 量化 分 析 技术 相 结合 ， 极 大 地 丰富 了 资 
产 配 置 的 内 涵 ， 形 成 了 现代 资产 配置 理论 的 基本 框架 。 

量化 投资 的 优势 有 以 下 几 点 。 

(1) 大 数据 量 的 市 场 分 析 。 这 是 投资 决策 的 基础 ， 定 性 交易 靠 的 是 人 工 调研 ， 所 以 没 
有 办 法 分 析 市 场 的 所 有 产品 。 但 量化 投资 可 以 分 析 市 场 的 所 有 数据 ， 从 而 可 以 获得 更 准确 
的 市 场 信息 ， 使 得 交易 决策 更 科学 、 更 系统 、 更 有 效 。 

(2) 快速 交易 。 量 化 技术 中 引 人 注 目的 是 快速 交易 ， 包 括 算法 交易 、 高 频 交 易 。 例 
如 ， 在 秒 级 时 间 内 完成 多 个 金融 产品 组 合 的 下 单 交 易 、 一 分 钟 完成 几 个 交易 周期 等 ， 这 些 
是 手工 方式 根本 无 法 想象 的 。 更 多 的 交易 机 会 意味 着 更 好 的 概率 显著 性 ， 从 而 获得 更 好 的 
投资 收益 。 

(3) 理性 交易 。 由 于 交易 决策 是 由 计算 机 程序 做 出 的 ， 不 为 人 的 主观 情绪 所 左右 ， 所 
以 下 单 交 易 表 现 出 良好 的 理性 ， 好 处 是 可 以 克服 人 性 的 弱点 ， 如 贪 禁 、 丸 惧 、 侥 幸 心 理 ， 
使 得 投资 更 加 理性 。 


4.4.2 证 券 量化 投资 中 的 主要 分 析 工 具 


在 金融 领域 中 ， 量 化 投资 的 主要 分 析 工 具有 数据 挖掘 、 人 工 智 能 、 小 波 分 析 、 随 机 过 
程 、 分 形 理 论 、 支 持 向 量 机 等 。 下 面 介绍 几 个 主要 的 分 析 工 具 。 

1) ”数据 挖掘 

数据 挖掘 是 从 数据 库 中 获取 信息 的 一 个 基本 方法 ， 其 常用 的 方法 有 决策 树 、 人 工 神经 
网 络 、 关 联 分 析 等 。 模 型 也 可 分 为 聚 类 模型 、 关 联 模型 、 顺 序 模型 等 。 数 据 挖掘 常常 应 用 
于 板块 轮 动 策略 中 。 板 块 轮 动 ， 指 的 是 板块 与 板块 之 间 出 现 轮 动 ， 推 动 大 盘 逐 步 上 扬 。 比 
如 ， 前 一 段 时 间 金 融 板块 率领 大 盘 上 涨 ， 现 在 是 地 产 板块 推动 大 盘 上 涨 ， 这 就 叫 作 金 融 板 
块 与 地 产 板块 出 现 了 板块 轮 动 效 应 。 由 于 股票 市 场 经 常 出 现 板块 轮 动 、 涨 跌 不 一 的 情况 ， 
因此 可 以 利用 基于 关联 规则 的 板块 轮 动 策略 进行 投资 。 

2) 人工 智能 

人 工 智能 是 计算 机 科学 的 一 个 分 支 ， 它 企图 了 解 智能 的 实质 ， 并 生产 出 一 种 新 的 能 以 
人 类 智能 相似 的 方式 做 出 反应 的 智能 机 器 。 人 工 智能 是 对 人 的 意识 、 思 维 的 信息 过 程 的 模 
拟 。 它 包括 了 机 器 学 习 、 自 动 推理 、 人 工 神经 算法 、 遗 传 算法 等 。 在 金融 投资 领域 中 ， 主 
要 运用 于 短线 投资 。 例 如 ， 同 花 顺 软件 的 “智能 选 股 ” 功 能 ， 就 是 基于 人 工 智 能 的 技术 ， 
推送 投资 者 理论 上 有 投资 价值 的 股票 。 
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3) ”小 波 分 析 

小 波 分 析 其 实 是 应 用 数学 和 工程 学 科 中 的 一 个 概念 ，“ 小 波 ” 就 是 小 的 波形 。 所 谓 
“小 ”是 指 它 具有 衰减 性 ， 而 称 之 为 “ 波 ” 则 是 指 它 的 波动 性 ， 其 振幅 正 负 相间 的 震荡 形 
式 。 它 能 根据 频率 的 变化 调整 分 析 窗 口 的 大 小 。 由 于 金融 时 间 序 列 具 有 非 平稳 性 、 非 线性 
的 特点 ， 因 此 传统 的 去 噪 方法 效果 不 好 ， 但 小 波 分 析 可 以 克服 这 些 缺 陷 。 

4) ”随机 过 程 

随机 过 程 是 指 选取 一 定 的 随机 变量 ， 通 过 观察 表面 的 偶然 性 描述 出 必然 的 内 在 规律 并 
以 概率 的 形式 来 描述 这 些 规律 。 研 究 随机 过 程 的 方法 多 种 多 样 ， 主 要 可 以 分 为 两 大 类 : 一 
类 是 概率 方法 ， 其 中 用 到 轨道 性 质 、 停 时 和 随机 微分 方程 等 ， 另 一 类 是 分 析 的 方法 ， 其 中 
用 到 测度 论 、 微 分 方程 、 半 群 理 论 、 函 数 堆 和 希 尔 伯 特 空间 等 。 研 究 的 主要 内 容 有 多 指标 
随机 过 程 、 无 穷 质 点 与 马尔 可 夫 过 程 、 概 率 与 位 势 及 各 种 特殊 过 程 的 专题 讨论 等 。 对 股市 
的 大 盘 进 行 预测 时 ， 经 常会 用 到 马尔 可 夫 链 。 


4.4.3 ”大 数据 在 证 券 量 化 投资 中 的 应 用 


大 数据 技术 在 证 券 量化 投资 中 的 应 用 可 根据 数据 结构 的 不 同 分 为 结构 化 数据 的 应 用 与 
非 结构 化 数据 的 应 用 两 种 应 用 方式 。 其 中 结构 化 数据 的 应 用 最 为 普遍 。 


1. 结构 化 数据 的 应 用 


在 量化 投资 中 ， 结 构 化 数据 应 用 主要 集中 于 高 频 交 易 应 用 。 高 频 交 易 (High Frequency 
Trading) 是 一 种 交易 策略 和 技术 ， 它 是 指 从 那些 人 们 无 法 利用 的 极为 短暂 的 市 场 变化 中 寻 
求 获 利 的 计算 机 化 交易 。 例 如 ， 某 种 证 券 买 入 价 和 卖 出 价差 价 的 微小 变化 ， 或 者 某 只 股票 
在 不 同 交易 所 之 间 的 微小 价差 。 高 频 交 易 具 有 交易 量 大 、 交 易 次 数 多 、 持 仓 日 短 等 特点 ， 
因此 计算 机 每 秒 需要 处 理 大量 的 结构 化 数据 。 此 外 ， 高 频 交 易 具 有 每 笔 收益 率 很 低 ， 但 是 
总 体 收益 稳定 的 特点 ， 因 此 深 受 国际 大 型 投资 机 构 的 青睐 。 

一 般 来 说 ， 高 频 交 易 可 以 分 为 两 大 类 。 

1) ”传统 的 低频 交易 高 速 化 

包括 高 频 统计 套利 、 高 频 阿尔 法 套利 、 高 级 趋势 追踪 等 。 其 中 高 频 阿尔 法 套利 中 的 配 
对 交易 最 为 典型 。 配 对 交易 是 指 从 市 场 中 寻找 历史 股价 走势 相近 的 股票 作为 配对 股票 ， 当 
股票 的 价格 差 偏 离 于 历史 均值 时 ， 则 卖 出 其 中 股价 较 高 的 股票 ， 买 入 股价 较 低 的 股票 ， 当 
二 者 的 价差 回归 历史 均值 水 平时 ， 分 别 平 仓 完成 套利 交易 。 另 外 ， 设 置 适当 的 止 损 点 结束 
头寸 以 控制 风险 。 配 对 交易 具有 广泛 的 应 用 性 ， 除 了 股票 这 一 标的 资产 外 还 可 以 应 用 到 期 
货 、 期 权 、 外 汇 等 。 

在 配对 交易 过 程 中 ， 获 取 大 数据 和 大 数据 分 析 方 法 至 关 重 要 。 首 先 ， 我 们 应 该 从 市 场 
中 获取 海量 的 交易 数据 ， 通 过 相关 性 分 析 方法 找到 价格 相关 走势 高 的 证 券 ， 然 后， 根据 海 
量 的 高 频 交 易 数 据 计 算 证 券 间 的 价格 差 ， 形 成 价格 差 的 概率 分 布 ， 之 后 依据 概率 分 布设 定 
触发 条 件 和 终止 条 件 的 阔 值 。 例 如 ， 当 证 券 价格 差 超 过 X 临界 值 时 开始 买 入 卖 出 证 券 ， 当 
价格 差 到 Y 临界 值 时 平 仓 。 最 后 ， 根 据 设 定 ， 若 某 证 券 价格 差 持 续 扩 大 到 乙 止 损 点 ， 可 以 
选择 平 仓 并 止 损 。 
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2) ”高 频 交易 策略 是 凭借 海量 数据 、 高 速 交 易 而 开发 的 新 策略 

这 类 策略 的 持仓 时 间 非 常 短 。 例 如 ， 自 动 做 市 商 策略 利用 量化 算法 优化 头寸 的 报价 和 
执行 ， 其 持仓 时 间 只 有 1 分 钟 。 市 场 微观 结构 交易 策略 对 观测 到 的 报价 进行 逆向 工程 解析 
以 获得 买卖 双方 下 单 流 的 信息 ， 该 策略 的 持仓 时 间 仅 为 10 分 钟 。 事件 交 易 策略 通过 宏观 
事件 进行 短期 交易 ， 该 策略 持仓 时 间 一 般 不 会 超过 1 小 时 。 由 此 可 见 ， 高 频 交易 一 般 不 涉 
及 隔夜 持仓 ， 因 此 它 避 免 了 隔夜 风险 。 这 在 流动 性 紧张 、 隔 夜 拆借 利率 高 的 情况 下 更 具有 
吸引 力 。 而 且 基于 计算 机 的 决策 算法 与 执行 算法 的 结合 能 够 有 效 避 免 人 工 决策 时 的 情绪 影 
响 ， 这 对 提高 整体 的 投资 收益 极为 关键 。 更 重要 的 是 ， 高 频 交 易 策略 拓展 了 投资 的 深度 与 
广度 ， 不 仅 充分 挖掘 了 市 场 的 潜在 信息 ， 而 且 拓 展 了 市 场 范 围 。 只 要 交易 模型 设计 合理 ， 
就 能 在 传统 分 析 师 不 熟悉 的 市 场 上 获得 稳定 的 收益 。 

另外 ， 开 发 高 频 交 易 策略 也 为 投资 者 带 来 了 巨大 的 挑战 。 首 先 ， 高 频 交 易 不 仅 数据 量 
异常 庞大 ， 而 且 数 据 之 间 的 时 间 间 隔 也 不 一 致 。 传 统 的 量化 分 析 的 方法 完全 不 适用 。 其 
次 ， 高 频 交 易 要 求 极 高 的 准确 性 ， 交 易 信 号 如 果 延 迟 或 者 提前 ， 投 资 者 很 可 能 在 一 瞬间 由 
蛋 利 转 为 亏损 。 最 后 ， 执 行 的 速度 是 高 频 交易 的 核心 。 提 高 交易 速度 是 各 投资 机 构 一 致 妃 
求 的 目标 ， 而 更 快 的 速度 需要 更 大 的 资金 投入 。 

可 以 看 出 ， 高 频 交 易 是 未 来 证 券 投资 领域 的 重要 发 展 方向 之 一 ， 其 稳定 的 投资 收益 与 
科学 的 决策 过 程 吸引 了 越 来 越 多 的 投资 者 加 入 。 目 前 ， 国 外 顶级 投资 机 构 60% 以 上 的 交易 
都 是 通过 高 频 交 易 完 成 的 ， 并 且 这 一 比例 还 在 不 断 扩 大 。 在 中 国 ， 随 着 金融 市 场 管制 进 一 
步 宽松 ， 适 合 进行 高 频 交 易 的 投资 品种 正 逐 步 增加 ， 高 频 交 易 将 会 得 到 更 多 国内 机 构 投资 
者 的 青睐 。 


2. 非 结构 化 数据 的 应 用 


目前 ， 非 结构 化 数据 在 量化 投资 领域 的 应 用 并 不 普遍 ， 但 业界 正在 进行 大 量 的 尝试 。 
非 结构 化 数据 能 够 提供 有 价值 的 信息 并 进而 获得 超额 利润 ， 这 推动 了 更 多 的 公司 在 这 方面 
加 大 投入 ， 并 取得 了 一 定 的 成 果 。 

【案例 4.1】 伏 流 投资 : 掘 金 大 数据 ， 筑 建 量化 投资 

“我 们 先是 一 家 数据 科技 公司 ， 然 后 才 是 资产 管理 公司 。” 傣 流 投资 强调 ， 公 司 将 大 
数据 、 量 化 分 析 和 交易 技术 作为 公司 的 基石 一 数据 分 析 和 数据 科技 是 基础 ; 量化 模型 分 
析 建 立 在 厚实 的 基础 数据 之 上 ， 致 力 于 SmartBeta、Alpha 的 发 现 和 获取 ; 交易 技术 则 为 实 
现 交 易 实 践 提 供 技术 支撑 ， 三 者 融合 ， 缺 一 不 可 。 

伏 流 投资 目前 拥有 成 熟 的 模型 和 策略 ， 过 括 不 同 周期 、 不 同 品 种 ， 可 容纳 资金 量 约 5 
亿 元 。 在 公司 内 部 ， 一 套 交 易 策略 从 研发 到 成 熟 ， 要 经 过 严格 的 回 测 分 析 、 黑 箱 测试 、 参 
数 检验 、 失 效 检验 、 边 界 分 析 ， 最 后 进入 策略 库 。 他 们 认为 ,策略 要 保持 一 致 性 ， 符 合 公 
司 收益 风险 特征 ; 要 观察 策略 在 正常 情况 下 sharp 比率 、 换 手 率 等 指标 的 表现 ;评判 策略 
是 否 失效 则 要 通过 市 场 检 验 。 伏 流 投 资 以 月 为 周期 更 新 策略 ， 调 整 策 略 参 数 ， 一 旦 失效 则 
停止 该 策略 。 

伏 流 投资 的 量化 模型 建立 在 基本 面 和 技术 面 数据 之 上 ， 同 时 参考 大 数据 与 情 面 数据 指 
标 作 为 参考 ， 即 考察 市 场 参 与 主体 和 大 众 的 情绪 认 知 。 此外， 成 交 量 也 会 作为 量化 模型 的 
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参考 。 

“量化 投资 最 大 的 风险 来 源 于 参数 调 优 过 度 拟 合 、 历 史 回 测 与 实际 交易 偏差 、 量 化 模 
型 失效 以 及 极端 行情 风险 。” 伏 流 投 资 提 到 ， 针 对 这 些 风 险 ， 公 司 建立 了 事前 、 事 中 和 事 
后 完整 的 风 控 体 系 一 一 事前 规划 、 事 中 全 程 监控 、 事 后 复 盘 分 析 。 

大 资 管 时 代 ， 伏 流 投资 亦 走 上 自主 发 行 产品 之 路 ， 目 前 首 只 产品 已 经 完成 备案 ， 该 产 
品 使 用 混合 型 策略 ， 投 资 标 的 包括 股票 和 商品 期 货 。 按照 公司 规划 ， 伏 流 投 资 未 来 产品 线 
将 逐渐 履 盖 量化 选 股 、 量 化 对 冲 ， 海 外 产品 、 固 定 收 益 类 产品 亦 在 计划 之 中 。 

伏 流 投资 认为 ， 量 化 投资 因为 其 风险 收益 可 度量 、 可 回 测 以 及 客观 等 特性 ， 加 之 交易 
工具 的 进步 ， 量 化 投资 将 成 为 主流 趋势 。 在 百 币 争 流 的 局 面 下 ， 私 幕 机 构 唯 有 在 人 才 、 策 
略 、 产 品 、 营 销 、 合 作 等 各 方面 有 综合 优势 ， 才 能 长 远 发 展 。 

未 来 3~5 年 ， 伏 流 投 资 将 着 力 多 策略 、 全 品种 、 全 天 候 的 研发 ， 把 人 才 培 养 、 技 术 
更 新 和 产品 绩效 作为 重点 工作 来 部 署 ， 进 一 步 拓宽 市 场 的 广度 和 深度 ， 丰 富 投资 策略 ， 不 
盲目 追求 资产 规模 ， 稳 健 发 展 ， 为 将 来 资产 管理 规模 的 扩展 做 好 准备 。 


(资料 来 源 : 《期 货 日 报 》 第 004 版 ,2016-07-20) 


【案例 4.2】 机 构 选 股 逻辑 基因 变异 ”量化 投资 互联 网 掘 金 大 数 据 

利用 互联 网 大 数据 挖 据 股 市 的 超额 收益 机 会 正成 为 近期 基金 业 的 一 股 新 潮流 。 而 动作 
较 快 的 当 属 广发 基金 和 南方 基金 这 两 家 基金 公司 。 

其 中 ， 广 发 基金 联合 百度 公司 、 中 证 指数 公司 开发 百 发 100 指数 ， 南 方 基金 则 携手 新 
浪 财经 、 深 证 信息 公司 推出 了 il00 指数 和 i300 指数 。 

基金 公司 竞相 开发 大 数据 指数 的 动力 在 于 ， 基 于 大 数据 筛选 出 来 的 组 合 ， 大 幅 跑 赢 现 
有 的 指数 基金 。 

中 证 指数 公司 提供 的 数据 显示 ， 自 2009 年 至 2014 年 6 月 30 日 ， 百 发 100 指数 的 累 
计 收 益 率 达到 545%。 同 期 ， 中 证 500、 中 证 全 指 、 沪 深 300 指数 的 收益 率 分 别 为 102%、 
56%、19%.。 

历史 收益 源 自 模 型 样本 的 模拟 测算 ， 外 界 对 其 收益 率 或 许 存 有 疑问 。 而 百 发 100 指数 
产品 在 模型 样本 外 的 实 盘 数据 ， 同 样 大 幅 跑 赢 主 流 指数 。 

2014 年 6 月 20 日 开始 ， 百 发 100 指数 进入 实 盘 运 行 阶段 。 自 此 至 同年 10 月 8 日 , 百 
发 100 指数 实现 的 累计 收益 率 达 到 43.33%。 同 期 ， 沪 深 300 指数 、 上 证 指数 和 创业 板 全 指 
的 收益 率 分 别 只 有 16.52%、17.74% 和 17.94%。 

i100 等 权重 指数 和 i300 等 权重 指数 的 历史 收益 率 ， 同 样 凸显 出 大 数据 的 优势 。 

自 2010 年 1 月 29 日 至 2014 年 7 月 31 日 ,i100 和 i300 的 累计 收益 率 分 别 达到 
222.40% 和 141.58%， 远 高 于 同期 创业 板 指 数 34.45% 的 累计 收益 率 ， 更 高 于 中 小 板 指数 
-8.95% 的 累计 收益 率 。 南 方 新 浪 大 数据 指数 自 8 月 开始 正式 进入 模型 样本 外 运行 。 其 中 ， 
i100 等 权重 指数 在 8 月 和 9 月 实现 的 月 收益 率 分 别 为 10.93%、15.63%。 这 意味 着 该 指数 
在 两 个 月 期 间 的 收益 率 达 到 26.56%。 

券商 的 研究 团队 同样 在 挖掘 “大 数据 ” 带 来 的 投资 机 会 。 其 中 ， 长 江 证 券 金融 工程 团 
队 自 年 初 即 建立 新 闻 选 股 模型 ， 自 1 月 12 日 开始 样本 外 跟踪 。 
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长 江 证 券 金融 工程 主管 范 辛 亭 发 布 的 研究 报告 显示 ，2014 年 1 月 22 日 至 8 月 15 日 ， 
新 闻 选 股 模型 累计 的 绝对 收益 率 达到 52.45%， 超 越 沪 深 300 指数 的 39.449%6， 超 越 中 证 500 
指数 的 30%。 

招商 证 券 金融 工程 高 级 分 析 师 夏 潇 阳 利用 深交 所 互动 易 披 露 的 调研 信息 ， 构 建 中 小 板 
创业 板 调 研 组 合 。 实 盘 跟 踪 的 结果 显示 ， 自 2014 年 年 初 至 9 月 30 上 日， 该 调研 组 合 实现 的 
累计 收益 率 为 29.31%， 跑 赢 中 小 板 指 数 14.91%， 超 越 创 业 板 指数 的 幅度 是 8.53%。 

无 论 是 长 江 证 券 、 招 商 证 券 构建 的 选 股 模型 ， 还 是 广发 基金 、 南 方 基金 推出 的 大 数据 
指数 ， 其 共同 点 在 于 引入 网 民 对 个 股 的 搜索 大 数据 作为 选 股 因子 。 

当 基 金 公司 和 券商 研究 将 互联 网 金融 的 大 数据 作为 选 股 因子 引入 模型 ， 代 表 着 资产 管 
理 机 构 在 指数 投资 上 重 构 选 股 逻辑 。 统 指数 编制 依赖 的 是 市 值 规模 、 成 交 金额 、 财 务 及 人 
值 等 传统 因子 。 它 最 大 的 缺点 是 采用 过 去 3 个 月 或 6 个 月 的 数据 去 预测 未 来 一 期 的 收益 
参数 对 历史 数据 有 严重 的 依赖 。 

利用 百度 数据 融入 了 投资 者 在 投资 决策 前 的 行为 规律 ， 对 未 来 的 市 场 投资 规律 有 一 定 
的 预测 作用 ， 其 预测 效果 好 于 传统 的 来 源 于 历史 数据 的 因子 数据 。 与 传统 指数 不 同 的 是 ， 
百 发 100 指数 的 编制 思路 是 跳出 行业 、 板 块 的 限制 ， 从 全 市 场 中 寻找 超额 收益 的 机 会 。 其 
选 股 模型 的 特点 是 ， 它 所 挑 的 股票 是 契合 未 来 市 场 或 行业 轮 动 热点 ， 且 基本 面 良 好 ， 未 来 
有 一 定 成 长 空间 的 价值 型 股票 。 不 过 引入 大 数据 的 模型 能 否 经 受 考 验 ， 还 有 待 时 间 验 证 。 


(资料 来 源 : 《21 世纪 经 济 报道 》 第 023 版 ，2014-10-10) 
本 章 总 结 


e@ ”大 数据 技术 已 经 在 证 券 行业 中 得 到 了 广泛 的 应 用 ， 主 要 应 用 于 在 股票 分 析 、 客 户 
关系 管理 、 投 资 情 绪 以 及 量化 投资 四 个 方面 。 

e@ ”在 股票 分 析 中 大 数据 技术 是 进行 基本 分 析 和 技术 分 析 良 好 的 工具 ， 主 要 运用 的 是 
数据 挖掘 的 方法 ， 例 如 决策 树 法 、 聚 类 分 析 法 、 人 工 神经 网 络 算法 、 时 间 序 列 分 
析 以 及 关联 分 析 等 。 

@ ”在 证 券 客户 关系 管理 中 ， 通 过 大 数据 技术 可 以 构建 客户 细 分 模型 (DFM 模型 ) 将 客 
户 进行 合理 的 分 类 ， 以 便 有 效 地 对 客户 进行 管理 。 证 券 公 司 一 般 以 客户 证 券 账户 
资产 以 及 交易 活跃 度 作 为 评定 客户 等 级 的 主要 标准 ， 不 同等 级 的 客户 其 服务 策略 
不 同 。 

此 外 证 券 公司 可 以 构建 客户 满意 度 模 型 来 分 析 存 量 客户 对 公司 的 满意 程度 ， 构 建 
客户 流失 预测 模型 (以 Logit 为 方法 ) 了 解 客户 流失 的 情况 以 及 导致 客户 流失 的 原 

因 ， 推 动 公司 形成 有 效 的 决策 ， 提 高 服务 质量 。 

e@ 大 数据 技术 也 可 以 应 用 于 衡量 投资 者 的 投资 情绪 。 证 券 公司 可 以 通过 一 些 量化 的 
主观 情绪 测量 指标 以 及 客观 情绪 测量 指标 了 解 投资 者 的 投资 情绪 ， 运 用 应 用 网 页 
抓 取 技术 、 特 征 挖掘 技术 以 及 情感 极 性 分 类 技术 等 方式 在 网 络 与 情 中 获取 重要 信 
息 。 从 而 为 其 自 营 投资 业务 提供 有 效 参 考 。 
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@ ”大 数据 技术 在 证 券 行业 中 最 为 广泛 也 最 为 重要 的 应 用 就 是 量化 投资 ， 大 数据 技术 
为 证 券 投 资 提供 多 种 投资 策略 ， 例 如 量化 选 股 、 量 化 择 时 、 量 化 套利 、 算 法 交易 
以 及 资产 配置 等 。 通 过 数据 挖掘 、 人 工 智能 、 小 波 分 析 、 随 机 过 程 、 分 形 理论 、 
支持 向 量 机 等 分 析 工 具 ， 使 让 证 券 投资 实现 了 高 频 化 、 智 能 化 。 


1. 在 股票 基本 分 析 中 ， 主 要 的 分 析 因 素 有 哪些 ? 
2. 试 述 大 数据 在 股票 基本 面 分 析 和 股票 技术 分 析 中 的 应 用 都 有 哪些 方法 ， 并 进行 简要 
的 介绍 。 
- 谈 谈 什么 是 客户 细 分 ， 并 简要 介绍 大 数据 技术 在 客户 细 分 中 的 应 用 。 
. 证 券 公 司 客户 流失 的 原因 是 什么 ? 简要 介绍 流失 客户 模型 建立 的 过 程 。 
. 什么 是 网 络 与 情 ? 网络 与 情 与 投资 者 情绪 之 间 有 着 什么 样 的 关系 ? 
. 试 介绍 国内 外 常见 的 投资 者 情绪 指标 并 说 明 分 析 网 络 与 情 中 投资 者 情绪 的 流程 。 
. 什么 是 量化 投资 ? 量化 投资 都 包括 哪些 策略 ? 
. 在 证 券 行 业 中 ， 量 化 投资 是 怎么 样 实现 的 ? 试 述 量化 投资 的 优势 。 


oo > 说 Cn 上 wm 
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@ 掌握 大 数据 保险 的 特征 、 应 用 @ 掌握 大 数据 在 保险 精准 营销 中 


阶段 和 主要 作用 的 应 用 
@ 掌握 大 数据 在 保险 承保 定价 中 @ 掌握 大 数据 在 保险 欺诈 识别 中 
的 应 用 的 应 用 


随 着 大 数据 时 代 的 到 来 ， 大 数据 技术 逐渐 渗透 于 各 个 行业 之 中 ， 并 不 断 地 颠覆 
传统 的 行业 管理 和 运营 思维 。 作 为 大 数据 的 生产 者 和 使 用 者 ， 保 险 行业 也 在 积极 应 
用 大 数据 技术 ， 但 保险 行业 的 大 数据 应 用 才刚 刚 起 步 ， 与 银行 业 和 证 券 业 相 比 其 应 
用 大 数据 的 能 力 还 相对 落后 。 这 主要 是 因为 保险 行业 的 数据 基础 尚未 完善 ， 其 内 部 
数据 大 多 仍 处 于 数据 孤岛 的 状态 ， 致 使 其 内 部 数据 难以 被 充分 挖掘 和 使 用 。 目 前 ， 
大 数据 技术 在 保险 行业 中 的 应 用 主要 体现 于 合理 的 承保 定价 、 精 准 的 保险 营销 和 有 
效 的 欺诈 识别 。 本 章 将 重点 讲解 大 数据 在 保险 行业 的 承保 定价 、 精 准 营销 和 欺诈 识 
别 中 的 作用 。 


© 
村 
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(QI 大 数据 保险 


5.1.1 大 数据 保险 的 概念 和 特征 


保险 的 业务 特点 使 其 天 然 就 具有 大 数据 的 特征 ， 具 体 表现 在 以 下 3 个 方面 。 

(1) 保险 业 是 经 营 风险 的 行业 。 

由 于 保险 业 是 经 营 风险 的 行业 ， 因 而 其 所 经 营 的 保险 产品 在 设计 时 需要 对 标的 物 的 风 
险 进行 精准 测定 。 而 风险 测定 要 以 充分 的 数据 为 基础 ， 保 险 公司 自身 已 掌握 海量 的 数据 , 
需要 利用 大 数据 技术 对 这 些 海量 数据 进行 分 析 从 而 有 效 地 量化 风险 。 

(2) 对 未 来 风险 的 预测 是 保险 公司 的 利润 来 源 。 

保险 公司 的 利润 来 源 于 其 向 投保 人 所 收取 的 保费 与 相应 标的 物 未 来 发 生 的 赔付 支 册 之 
间 的 差额 ， 因 而 保险 公司 需要 对 相应 标的 物 未 来 风险 发 生 的 概率 进行 预测 。 而 预测 正 是 大 
数据 的 核心 功能 ， 与 保险 经 营 的 关键 需求 不 谋 而 合 。 

G) 保险 经 营 的 过 程 中 包含 着 数据 的 产生 与 使 用 。 

保险 经 营 的 过 程 包 括 产品 设计 、 产 品 营销 、 承 保定 价 、 风 险 防 控 、 核 保 理赔 等 一 系列 
环节 。 在 这 些 环节 的 具体 运行 过 程 中 ， 大 量 的 相关 数据 被 不 断 地 利用 ， 更 多 新 的 可 利用 数 
据 也 在 这 一 过 程 中 不 断 产生 。 

1. 大 数据 保险 的 概念 


大 数据 保险 是 指 保险 公司 通过 利用 大 数据 技术 对 风险 数据 进行 分 析 、 处 理 和 挖 握 ， 使 
风险 数据 实现 有 效 的 价值 变现 。 在 此 基础 上 保险 公司 通过 其 治理 端 和 商业 端的 协同 创新 ， 
使 传统 的 保险 服务 方式 和 资源 配置 方式 得 以 优化 ， 从 而 实现 保险 产品 、 保 险 服务 和 保险 业 
务 模式 的 创新 ， 进 而 更 好 地 满足 其 客户 需求 并 提供 更 为 优质 的 保险 服务 。 


2. 大 数据 保险 的 特征 


大 数据 保险 所 具有 的 特征 表现 为 以 下 6 个 方面 。 

1) “数据 驱动 

与 互联 网 保险 的 渠道 驱动 所 不 同 的 是 ， 大 数据 保险 是 由 数据 驱动 的 。 保 险 数据 处 理 技 
术 的 变革 和 应 用 是 大 数据 保险 发 展 的 关键 驱动 力 。 大 数据 技术 不 仅 可 以 在 保险 公司 建立 风 
险 模型 和 对 产品 进行 定价 的 过 程 中 被 充分 利用 ， 也 能 够 在 承保 理赔 过 程 中 的 各 环节 发 挥 
作用 。 

2) ”问题 思维 

在 运用 大 数据 技术 实现 数据 挖掘 和 数据 价值 变现 的 过 程 中 ， 大 数据 技术 消灭 信息 不 对 
称 、 不 匹配 的 能 力 得 以 体现 。 保 险 公司 在 业务 开展 过 程 中 所 遇 到 的 难点 和 痛 点 ， 正 是 应 用 
大 数据 技术 的 重点 ， 通 过 利用 大 数据 技术 对 数据 进行 分 析 和 处 理 ， 之 前 的 难点 和 痛 点 将 变 
为 大 数据 保险 的 创新 点 。 

3) ”融合 创新 

大 数据 技术 在 保险 领域 中 的 应 用 使 保险 业 在 与 新 技术 相 融 合 的 过 程 中 ， 推 出 更 多 具有 
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创新 性 的 产品 和 服务 ， 也 使 保险 公司 的 业务 模式 得 到 了 创新 和 优化 。 

4) ”运营 提升 

通过 利用 大 数据 技术 ， 大 数据 保险 的 资金 摩擦 被 最 小 化 ， 资 源 配置 的 过 程 得 到 充分 的 
优化 ， 进 而 使 其 运营 效能 得 到 了 有 效 的 提升 。 

5) ”活力 生态 

随 着 大 数据 技术 与 保险 行业 的 深度 融合 ， 数 字 生态 系统 的 建立 势 在 必 行 。 在 这 一 生态 
系统 中 不 仅 有 保险 公司 的 参与 ， 还 会 有 其 他 行业 的 参与 者 参与 其 中 。 数 据 在 这 一 生态 系统 
中 不 断 地 更 新 ， 从 而 使 得 该 生态 系统 更 加 具有 活力 。 

6) ”服务 导向 

在 传统 保险 中 ， 虽 然 众 多 保险 公司 早已 将 针对 客户 需求 的 服务 导向 作为 其 经 营 的 核心 
价值 观 ， 但 碍 于 时 间 与 空间 上 的 信息 不 对 称 ， 该 服务 导向 在 重重 制约 中 被 扭曲 。 大 数据 保 
险 通过 利用 大 数据 技术 在 交互 的 价值 网 络 中 及 时 有 效 地 获取 信息 ， 实 现 了 信息 数据 的 透明 
化 ， 进 而 帮助 保险 公司 提供 真正 从 客户 需求 出 发 的 保险 服务 。 


5.1.2 保险 业 大 数据 应 用 的 阶段 
1. 世界 保险 业 的 数据 应 用 发 展 阶段 


保险 业 的 经 营 和 发 展 与 数据 应 用 密 不 可 分 ， 因 而 保险 业 数 据 应 用 沿革 的 历史 也 是 其 发 
展 的 历史 。 根 据 世 界 保险 业 在 不 同时 代数 据 能 力 和 技术 水 平 的 不 同 ， 我 们 可 以 将 其 数据 应 
用 发 展 过 程 分 为 4 个 阶段 ， 分 别 是 数据 匮乏 时 期 、 统 计数 据 应 用 时 期 、 信 息 技术 应 用 时 期 
和 大 数据 技术 应 用 时 期 ， 如 图 5.1 所 示 。 


人 技术 水 平 21 志 纪 
分 析 能 力 强 大 数据 技术 
20 世 纪 应 用 时 期 

50 年 代 中 期 快速 处 理 


信息 技术 | 深度 挖 所 
应 用 时 其 


18 世 纪 数据 挖掘 


统计 数据 
应 用 时 期 


数据 统计 


数据 匮乏 时 期 


经 验 判 断 


~ 数据 能 力 
数据 来 源 丰 富 、 结 构 多 样 


图 5.1 保险 业 数据 应 用 的 发 展 阶段 
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(1) 18 世纪 之 前 ， 世 界 保险 业 处 于 数据 匮乏 时 期 。 当 时 承保 人 获取 信息 的 渠道 非常 有 
限 且 信息 可 靠 性 较 低 ， 风 险 定 价 主要 依赖 于 承保 人 的 经 验 判断 。 

(2) 18 世纪 寿险 生命 表 和 均衡 保费 理论 出 现 ， 世 界 保险 业 进入 统计 数据 应 用 时 期 。 在 
这 一 阶段 数学 方法 和 统计 手段 开始 应 用 于 保险 定价 中 ， 从 而 使 寿险 业 得 到 快速 发 展 。 

(3) 随 着 信息 技术 在 20 世纪 50 年 代 中 期 的 快速 发 展 和 广泛 应 用 ， 世 界 保险 业 进 入 信 
息 技术 应 用 时 期 。 在 这 一 阶段 保险 经 营 过程 中 所 依赖 的 数据 基础 得 到 不 断 的 扩充 ， 行 业 数 
据 应 用 水 平 也 在 日 益 提高 。 

(4) 进入 21 世纪 ， 随 着 移动 互联 网 、 社 交 网 络 、 大 数据 等 新 技术 的 出 现 和 快速 发 
展 ， 世 界 保险 业 数 据 应 用 进入 了 大 数据 应 用 时 期 。 在 这 一 阶段 保险 业 所 掌握 的 数据 从 内 部 
数据 扩展 到 外 部 数据 ， 从 定量 数据 扩展 到 定性 数据 ， 从 结构 化 数据 扩展 到 半 结 构 化 数据 和 
非 结 构 化 数据 ， 从 交易 数据 扩展 到 行为 数据 ， 数 据 来 源 不 断 丰 富 ， 数 据 结构 更 加 多 样 。 


2. 保险 业 大 数据 应 用 的 阶段 


结合 大 数据 技术 的 发 展 趋势 ， 可 以 将 保险 业 大 数据 的 应 用 分 为 3 个 阶段 : 内 部 循环 、 
外 延 拓展 和 全 面 应 用 ， 如 图 5.2 所 示 。 


内 部 循环 阶段 外 延 拓 展 阶 段 全 面 应 用 阶段 


内 部 数据 外 部 数据 普遍 性 
闭环 应 用 领域 拓展 专业 性 


图 5.2 保险 业 大 数据 应 用 的 阶段 


(1) 内 部 循环 阶段 。 保 险 公司 利用 其 在 业务 经 营 活动 中 所 产生 的 大 量 内 部 数据 ， 通 过 
利用 大 数据 技术 进行 深度 的 挖掘 分 析 ， 实 现 以 数据 指导 决策 ， 帮 助 业务 流程 有 效 优化 。 
在 此 基础 上 更 多 的 客户 被 吸引 并 带 来 更 多 新 的 可 利用 数据 ， 从 而 形成 具有 正 向 激励 特征 
的 闭环 。 

(2) 外 延 拓展 阶段 。 保 险 公司 开始 尝试 利用 内 部 数据 解决 其 主要 产品 及 服务 以 外 的 问 
题 ， 进 而 拓展 其 内 部 数据 的 应 用 领域 ;或 是 引入 与 其 主要 产品 和 服务 直接 或 间接 相关 的 外 
部 数据 ， 通 过 利用 大 数据 技术 进行 充分 的 挖掘 和 分 析 更 好 地 解决 其 发 展 中 所 遇 到 的 问题 ， 
并 为 其 提供 更 多 的 创新 机 会 。 

(3) 全 面 应 用 阶段 。 经 过 行业 相关 数据 的 规模 化 和 规范 化 发 展 ， 在 行业 数据 产业 链 上 
分 化 出 数据 提供 者 、 数 据 加 工 者 、 数 据 消费 者 等 专业 化 组 织 。 在 这 一 阶段 中 ， 数 据 来 源 愈 
加 丰富 化 ， 数 据 结构 愈加 多 样 化 ， 大 数据 技术 的 应 用 也 更 加 具有 普及 性 和 专业 性 ， 行 业 技 
术 水 平和 分 析 能 力也 在 不 断 提 高 。 


5.1.3 ”大 数据 在 保险 行业 中 的 作用 


随 着 大 数据 技术 与 保险 行业 的 逐渐 深度 融合 ， 保 险 公 司 将 实现 对 大 规模 、 多 样 化 的 数 
据 的 及 时 获得 和 快速 分 析 。 在 可 预见 的 未 来 ， 保 险 产 品 和 服务 的 性 质 将 会 发 生根 本 性 的 变 
化 ， 即 保险 价值 将 会 更 多 地 体现 在 后 端 专业 化 的 风险 解决 方案 上 ， 而 不 再 是 风险 条 件 触发 
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后 的 赔付 。 

1) 产品 和 服务 的 个 性 化 

在 传统 的 保险 经 营 中 ,保险 产品 和 服务 的 设计 、 营 销 、 推 广 等 环节 仅 关注 于 具有 相似 
特征 的 某 一 客户 群体 ， 而 不 是 具体 的 单一 客户 。 保 险 公司 通过 利用 自然 语言 识别 、 文 本 挖 
掘 、 模 糊 判断 等 大 数据 技术 ， 可 以 对 单一 客户 在 社交 平台 上 留 下 的 海量 数据 进行 挖掘 和 分 
析 ， 从 而 了 解 该 客户 的 行为 习惯 、 风 险 偏好 和 保险 态度 ， 进 而 为 其 提供 个 性 化 的 保险 服务 
和 精准 的 风险 控制 。 

2) “风险 衡量 的 精准 化 

保险 公司 借助 大 数据 技术 ， 可 以 实时 地 对 与 单一 客户 相关 的 海量 数据 进行 挖掘 和 分 
析 ， 从 而 实现 对 该 客户 实时 且 精 细 化 的 风险 衡量 。 例 如 ， 对 于 车 险 客 户 ， 保 险 公 司 通过 对 
其 所 获取 的 客户 驾驶 行为 信息 、 车 辆 行驶 信息 和 交管 局 的 违章 信息 等 信息 数据 进行 处 理 ， 
精准 地 衡量 出 该 客户 当日 的 风险 状况 进而 计算 出 其 当天 应 缴纳 的 保费 。 

3) “保险 价值 链 的 再 创新 

大 数据 技术 的 应 用 使 保险 公司 的 外 部 交易 成 本 得 到 大 幅 降低 ， 进 而 帮助 保险 公司 实现 
资源 的 有 效 整合 ， 促 使 保险 价值 链 实现 再 创新 。 

4) ”供应 商 的 优化 整合 

保险 公司 在 其 长 期 的 经 营 过 程 中 积累 了 大 量 的 客户 数据 。 在 借助 大 数据 技术 对 这 些 海 
量 客户 数据 进行 整合 和 分 析 的 基础 上 ， 保 险 公 司 可 以 与 汽车 修配 人 企业、 医院、 药品 生产 企 
业 等 相关 机 构 开 展 更 加 深度 的 合作 ， 在 降低 其 经 营 成 本 的 同时 为 客户 提供 更 加 便捷 的 服务 。 

5) ”保险 需求 的 发 现 和 引导 

在 当前 快速 发 展 的 信息 时 代 ， 人 们 在 依托 互联 网 所 建立 的 社交 平台 上 发 布 信息 、 交 流 
观点 和 表达 想法 。 保 险 公 司 通过 借助 大 数据 技术 对 这 些 社交 平台 上 的 信息 数据 进行 挖掘 和 
分 析 ， 能 够 及 时 有 效 地 获取 人 们 的 关注 点 和 行为 偏好 ， 进 而 找 出 潜在 的 新 保险 需求 ， 设 计 
出 有 针对 性 的 保险 产品 和 服务 ， 实 现 对 客户 保险 需求 的 及 时 发 现 和 有 效 引导 。 

6) ”商业 机 会 的 有 效 发 气 

保险 公司 在 数据 方面 具有 得 天 独 厚 的 优势 。 在 当前 的 大 数据 时 代 ， 保 险 公司 通过 利用 
大 数据 技术 对 其 所 掌握 的 大 量 业 务 数据 进行 分 析 、 挖 掘 ， 可 以 对 其 所 获得 的 数据 处 理 结果 
加 以 利用 ， 从 而 发 掘 出 更 多 的 商业 机 会 。 例 如 ， 保 险 公司 可 以 建立 销售 平台 向 消费 者 出 售 
适当 的 车 辆 维修 保养 服务 。 

7) ”企业 生态 系统 的 再 构建 

保险 公司 在 利用 大 数据 技术 的 过 程 中 ， 其 与 外 部 市 场 之 间 的 边界 日 趋 模糊 ， 即 保险 公 
司 开始 尝试 与 其 他 行业 领域 进行 融合 和 合作 ， 从 而 构建 起 基于 大 数据 的 企业 生态 系统 。 

8) ”行业 格局 的 快速 变化 

随 着 互联 网 与 人 们 生活 的 日 趋 紧 密 ， 越 来 越 多 的 互联 网 公司 借助 其 在 大 数据 利用 方面 
的 优势 进军 保险 行业 。 例 如 ， 阿 里 集团 、 腾 讯 、 京 东 等 互联 网 公司 均 已 开通 其 保险 平台 。 
此 外 ， 一 些 从 事 保险 中 介 服 务 的 机 构 也 建立 了 线 上 的 “保险 超市 ”专门 销售 各 类 保险 产 
品 ， 它 们 依托 大 数据 技术 为 其 客户 提供 专业 的 保险 业务 咨询 和 个 性 化 的 保险 方案 定制 
服务 。 
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5.1.4 ”大 数据 下 的 数据 服务 架构 
1. 调整 前 后 的 数据 服务 架构 对 比 
在 大 数据 技术 应 用 以 前 ， 保 险 公司 为 满足 其 业务 经 营 的 需要 已 针对 其 所 掌握 的 结构 化 


数据 建立 起 一 套数 据 服务 架构 。 在 当前 的 大 数据 技术 应 用 的 背景 下 ， 保 险 公 司 为 实现 对 海 
量 半 结 构 化 数据 和 非 结构 化 数据 的 处 理 和 分 析 ， 需 要 结合 相关 大 数据 技术 对 其 数据 服务 架 
构 进行 调整 。 保 险 公司 调整 前 后 的 数据 服务 架构 对 比如 图 5.3 所 示 。 
f 一 ™ A sy 
数据 应 用 数据 应 用 
客户 | | 风险 | | 运营 || 市 场 | | 即席 户 运营 即席 
@ 
ti A 
me 
数据 分 析 了 可 耸 折 
OLAP: OLAP: 、 
| OLAP 多 维 雪 所 库 多 层 汇总 关系 型 数 据 库 ] 罗 的 
Se 
f | 
数据 ETL 处 理 = 
SSIS 工 具 等 传统 数据 仓库 ETL 工 具 = a 
\ eh 汪 ——C— - 
三 f N 
数据 仓库 存储 数据 仓库 存储 
HDFS 文 件 系 统 \ 
传统 关系 型 数据 库 传统 关系 型 数据 库 Hb 这 所 大 
ES 人 
「 数据 源 数据 源 
心 MIS Ml 入 


现 有 数据 服务 构架 调整 后 的 数据 服务 构架 


图 5.3 ”保险 公司 数据 服务 架构 的 前 后 对 比 


调整 前 后 的 数据 服务 架构 之 间 的 主要 区 别 在 于 Hadoop 技术 被 引入 数据 服务 架构 :在 
数据 存储 方面 ， 增 加 了 HDFS 文件 系统 和 Hbase 数据 库 ; 在 数据 分 析 方面 ， 增 加 了 
MapReduce、Hive、Pig 等 技术 对 存储 数据 进行 计算 和 分 析 。 

调整 后 的 数据 服务 架构 的 主要 变化 具体 表现 为 以 下 3 个 方面 。 

1) ”数据 源 范围 扩大 

在 数据 源 中 增加 了 半 结 构 化 数据 和 非 结构 化 数据 ， 呼 叫 中 心 记录 的 语音 数据 、 客 户 社 
交 数 据 、 相 关 文 档 数 据 等 都 被 纳入 其 中 ， 使 保险 公司 各 类 数据 的 商业 价值 被 最 大 化 地 利用 
起 来 。 
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2) ”数据 存储 工具 增加 

增加 了 HDFS 文件 系统 对 分 布 式 文件 数据 进行 存储 管理 ， 以 及 Hbase 数据 库 对 海量 结 
构 化 数据 进行 存储 管理 ， 从 而 使 保险 公司 的 经 营 管理 能 力 随 数据 量 的 不 断 增长 而 逐渐 提升 。 

3) “数据 分 析 工 具 增 加 

在 数据 分 析 过 程 中 增加 了 MapReduce、Hive、Pig 等 技术 ， 从 而 实现 对 Hadoop 数据 的 
分 析 和 计算 。 

2. 调整 后 的 数据 服务 架构 


从 图 5-3 中 我 们 可 以 看 到 ， 调 整 后 的 数据 服务 架构 将 采用 传统 数据 库 技术 与 Hadoop 
技术 相 结合 的 方式 来 满足 保险 公司 的 数据 处 理 需求 。 传 统 数据 库 技术 与 Hadoop 技术 的 结 
合 方式 可 视 保 险 公 司 的 实际 需要 灵活 调整 : 既 可 以 选择 用 传统 技术 处 理 结构 化 数据 ， 用 
Hadoop 技术 处 理 半 结 构 化 和 非 结 构 化 数据 ; 也 可 以 选择 将 传统 数据 库 中 的 结构 化 数据 导入 
Hadoop 之 中 ， 进 而 借助 Hadoop 技术 来 提升 保险 公司 对 海量 数据 的 处 理 能 


5.1.5 ”保险 业 大 数据 应 用 现状 
1. 总 体 特点 


在 金融 领域 中 ， 保 险 行业 应 用 大 数据 相对 较 晚 ， 应 用 水 平 也 落后 于 银行 业 和 证 券 业 。 
这 是 因为 银行 业 与 证 券 业 的 数据 服务 平台 建设 较 早 ， 从 而 为 大 数据 技术 的 应 用 葛 定 了 良好 
的 基础 ， 而 保险 业 的 数据 服务 平台 建设 则 相对 较 晚 。 

而 就 保险 业 自 身 的 大 数据 应 用 阶段 而 言 ， 目 前 尚且 处 于 大 数据 应 用 的 初级 阶段 ， 即 内 
部 循环 阶段 。 因 而 接 下 来 保险 业 需 要 通过 合理 利用 其 内 部 数据 并 引入 更 多 的 外 部 数据 来 拓 
展 大 数据 分 析 在 本 行业 中 的 应 用 领域 。 

从 全 球 范围 上 来 看 ， 国 外 保险 业 的 大 数据 应 用 水 平 高 于 国内 保险 业 。 


2. 国内 保险 业 大 数据 应 用 的 特点 
国内 保险 业 的 大 数据 应 用 具有 4 个 特点 ( 见 图 5.4)， 具 体 介 绍 如 下 。 


重视 大 数据 技术 的 数据 基础 和 
应 用 价值 利用 效率 较 差 
大 数据 技术 的 专业 人 才 团 队 
应 用 程度 有 限 建设 困难 


图 5.4 国内 保险 业 大 数据 应 用 的 特点 
1) ”重视 大 数据 技术 的 应 用 价值 
目前 ， 国 内 保险 业已 经 对 大 数据 技术 的 重要 应 用 价值 形成 广泛 共识 ， 认 为 大 数据 技术 
将 给 传统 保险 业 带 来 深刻 的 变革 ， 大 数据 技术 的 应 用 能 力也 将 成 为 保险 公司 未 来 的 核心 竞 
争 力 。 
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2) ”数据 基础 和 利用 效率 较 差 
目前 国内 保险 业 的 相关 数据 积累 还 十 分 有 限 。 根 据 权 威 机 构 的 调查 显示 ， 我 国保 险 业 
的 数据 资源 总 量 较 少 ， 且 主要 以 结构 化 数据 为 主 。 虽 然 保险 公司 已 积累 一 定量 的 半 结 构 化 
数据 和 非 结构 化 数据 ， 但 对 这 些 数据 的 利用 效率 仍然 较 低 。 
3) “大 数据 技术 的 应 用 程度 有 限 
目前 国内 大 部 分 保险 公司 尚且 处 于 对 大 数据 技术 的 学 习 理解 阶段 ， 虽 然 已 有 少 部 分 保 
险 公司 开始 了 对 大 数据 技术 应 用 的 小 规模 试验 ， 但 尚未 出 现 大 规模 的 大 数据 商业 应 用 。 此 
外 ， 国 内 保险 业 对 大 数据 技术 的 应 用 主要 集中 在 营销 领域 ， 应 用 范围 也 较为 有 限 。 
4) 专业 人 才 团 队 建 设 困难 
目前 国内 只 用 少 部 分 的 保险 公司 建立 了 专门 从 事 大 数据 研发 的 团队 。 而 且 大 多 数 保险 
公司 的 大 数据 研发 人 员 主 要 来 自信 息 技术 部 门 ， 缺 少 同时 具备 金融 保险 知识 和 信息 技术 素 
养 的 跨 学 科 复合 型 人 才 。 

3. 保险 业 大 数据 挖掘 所 面临 的 主要 问题 

1) ”数据 的 对 接 

由 于 金融 行业 十 分 重视 数据 的 安全 性 ， 因 此 行业 内 的 相关 数据 都 具有 较 高 的 保密 性 。 
所 以 ， 如 何 与 金融 同业 机 构 在 确保 相关 数据 安全 的 基础 上 进行 数据 的 共享 就 成 为 保险 公司 
在 大 数据 挖掘 中 所 要 解决 的 问题 。 

2) “数据 的 考量 

由 于 人 们 的 行为 活动 在 不 断 地 进行 ， 因 而 客户 行为 的 相关 数据 也 在 不 断 地 产生 之 中 。 
保险 公司 会 基于 数据 分 析 对 客户 进行 画像 ， 但 很 难 通过 几 个 固定 的 标签 就 描绘 出 客户 画 
像 ， 即 客户 的 标签 特征 也 在 不 断 地 变化 之 中 。 在 不 同 的 场景 下 ， 同 一 个 客户 可 能 分 别 被 定 
义 为 有 需求 客户 和 无 需求 客户 。 因 此 ， 保 险 公 司 在 大 数据 挖掘 过 程 中 要 注意 实时 数据 的 识 
别 问题 。 

3) 数据 的 应 用 

在 做 好 数据 的 获取 和 挖掘 工作 后 ， 如 何 有 效 地 利用 大 数据 技术 应 用 下 的 数据 分 析 结 果 
成 为 保险 公司 所 要 回答 的 问题 。 目 前 ， 国 内 保险 业 的 大 数据 应 用 主要 集中 在 营销 领域 ， 因 
而 有 待 大 数据 在 产品 设计 、 承 保定 价 、 核 保 理赔 、 风 险 防 控 等 领域 也 发 挥 深层 次 的 作用 。 


4. 保险 业 大 数据 应 用 的 潜在 突破 口 


1) 承保 范围 的 扩大 

在 大 数据 技术 的 应 用 下 ， 过 去 不 可 承保 的 风险 也 将 有 可 能 成 为 可 以 承保 的 风险 ， 更 多 
潜在 的 时 新 的 保险 需求 也 将 被 有 效 激发 。 目 前 已 为 人 们 所 熟知 的 退货 运费 险 正 是 大 数据 在 
保险 业 中 应 用 的 产物 。 

2) “个 性 定价 的 实现 

在 大 数据 应 用 的 背景 下 ， 随 着 保险 公司 所 掌握 的 数据 在 数量 上 日 趋 庞大 、 在 维度 上 日 
趋 宽广 ， 其 保险 定价 的 精确 度 也 日 趋 提 高 。 这 是 因为 保险 公司 通过 应 用 大 数据 技术 使 其 所 
面临 的 逆向 选择 风险 得 以 降低 ， 产 品 定价 的 优化 和 保险 费 率 的 个 性 化 制定 也 将 得 以 实现 。 

3) ” 核 保 理赔 的 优化 
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保险 公司 通过 利用 大 数据 技术 对 海量 数据 进行 分 析 建 模 ， 可 以 使 自动 化 的 核 保 理赔 过 
程 得 以 有 效 实现 。 例 如 ， 北 京 市 保 监 局 与 北京 市 交管 局 联合 推出 的 APP 一 一 “事故 e 理 
赔 ” 就 是 大 数据 在 保险 核 保 理赔 环节 的 典型 应 用 。 

4) ”风险 防 控 的 提升 

作为 经 营 风 险 的 企业 ， 保 险 公 司 在 其 日 常 经 营 过 程 中 面临 着 诸多 风险 。 这 些 风险 不 仅 
表现 为 投保 人 的 逆向 选择 问题 和 道德 风险 ， 也 表现 为 保险 公司 自身 的 操作 风险 、 信 用 风险 
等 相关 风险 。 保 险 公 司 通过 有 效 运 用 大 数据 技术 ， 可 以 使 其 风险 管理 能 力 和 水 平 得 到 
提高 。 例 如 ， 将 大 数据 技术 应 用 于 核 保 理赔 环节 ， 能 够 有 效 地 提高 保险 公司 的 欺诈 监 
测 能 力 。 

5) 运营 效率 的 提高 

保险 公司 还 可 以 将 大 数据 技术 应 用 到 相关 运营 环节 当中 ， 如 人 力 资源 管理 、 财 务 管理 
等 ， 从 而 实现 保险 公司 运营 管理 水 平 的 有 效 提升 。 


5. 案例 : 大 数据 与 保险 业务 模式 创新 
通过 运用 大 数据 技术 ， 国 外 保险 公司 在 业务 模式 方面 有 了 诸多 创新 ， 具 体 有 以 下 几 个 
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1) ”客户 参与 度 的 提高 
澳大利亚 的 Youi 保险 公司 为 了 提升 其 客户 满意 度 ， 借 助 大 数据 技术 对 其 客户 反馈 方 
式 进行 改进 。Youi 保险 公司 将 其 客户 评价 实时 公开 在 其 网 站 上 ， 客 户 在 浏览 其 网 站 时 不 仅 
可 以 在 屏幕 下 方 看 到 关于 该 公司 的 最 新 评价 ， 还 可 以 通过 选择 关键 字 对 所 有 评价 进行 过 
滤 。Youi 公司 通过 引入 该 方法 在 客户 服务 方面 取得 了 成 功 。 

2) “车 载 信息 系统 的 利用 

Progressive 保险 公司 利用 车 联网 推出 了 UBI 车 辆 保险 产品 ， 从 而 大 幅 降低 了 其 车 险 投 
保 人 的 投保 费 率 ， 并 在 此 基础 上 为 其 投保 人 提供 一 系列 与 车 辆 相关 的 增值 服务 。 

3) ”保险 生态 系统 的 建立 

中 国平 安保 险 集团 依托 大 数据 技术 建立 了 其 完整 的 保险 生态 系统 ， 其 所 提供 的 保险 产 
品 和 服务 仅仅 作为 该 生态 系统 中 的 一 部 分 参与 其 中 。 在 提供 传统 保险 服务 的 基础 上 ， 该 生 
态 系统 为 了 最 大 限度 地 挖掘 客户 潜力 并 保有 客户 ， 还 能 够 提供 创新 服务 。 

4) “基于 社交 网 络 的 互助 保险 

Friendsurance 公司 和 RiskHuddle 公司 基于 社交 网 络 向 其 客户 提供 互助 保险 ， 涉 及 个 人 
责任 险 、 家 具 险 等 险种 。 在 该 互助 保险 中 ， 基 于 社交 网 络 所 形成 的 小 团体 ， 团 体 成 员 相 互 
承保 并 形成 资产 地; 当 某 一 成 员 出 险 需 要 理赔 时 ， 相 关 款 项 先 由 该 资金 池 支付 ， 资 金池 不 
能 覆盖 的 部 分 才 由 保险 公司 支付 。 在 该 模式 中 客户 的 投保 费用 和 保险 公司 的 理赔 风险 都 得 
到 了 降低 。 

5) ”销售 方式 的 创新 

Bought by Many 公司 通过 利用 大 数据 技术 来 识别 潜在 客户 的 特定 保险 需求 ， 并 将 其 识 
别 到 的 潜在 客户 需求 与 众多 保险 公司 的 保险 产品 相 匹 配 ， 继 而 通过 社交 媒体 和 搜索 引擎 将 
所 匹配 的 保险 产品 营销 给 该 类 潜在 客户 。 在 此 销售 方式 下 客户 的 投保 开销 和 保险 公司 的 客 
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户 流失 率 都 得 到 降低 。 


@E3 承保 定价 


近 些 年 来 ， 保 险 业 所 面临 的 外 部 环境 发 生 了 诸多 变化 ， 这 些 变 化 主要 表现 在 人 口 结 
构 、 技 术 创 新 、 金 融 产品 和 服务 的 融合 发 展 等 方面 。 为 了 应 对 这 些 变化 ， 保 险 公司 可 以 借 
助 大 数据 技术 来 提高 其 获取 和 深度 挖掘 信息 的 能 力 ， 通 过 对 客户 的 交易 行为 进行 记录 、 分 
析 和 预测 ， 提 高 其 承保 定价 能 力 。 


5.2.1 大 数据 与 传统 保险 定价 理论 
1. 大 数据 与 大 数 法 则 


保险 作为 一 种 风险 管理 的 工具 ， 是 建立 在 社会 群体 之 间 的 风险 救助 机 制 。 而 保险 产品 
的 设计 机 理 主要 是 基于 统计 学 范畴 中 的 大 数 法 则 ， 即 基于 风险 发 生 和 损失 的 历史 数据 进行 
分 析 和 预测 ， 在 重复 地 随机 现象 中 找 出 具有 一 定 必然 性 的 规律 ， 进 而 依靠 精算 技术 对 产品 
进行 定价 并 建立 合理 的 财务 运行 机 制 。 大 数据 与 大 数 法 则 虽然 都 是 在 大 量 数据 基础 上 进行 
风险 和 财务 预测 ， 但 二 者 在 保险 产品 定价 机 制 中 的 作用 基点 是 完全 不 同 的 。 

大 数 法 则 是 保险 定价 的 根本 法 则 ， 特 别 是 对 于 车 险 、 寿 险 、 健 康 险 等 关系 社会 公众 利 
益 的 领域 ， 保 险 公 司 必须 依托 大 数 法 则 来 确保 其 行业 基准 纯 风 险 损失 率 的 厘定 是 公平 、 充 
足 且 安全 的 。 即 大 数 法 则 是 保险 运行 管理 的 数理 逻辑 ， 是 保险 业 不 可 动摇 的 理论 和 定价 基 
础 。 而 大 数据 则 主要 在 保险 定价 中 发 挥 辅助 作用 ， 特 别 是 通过 采集 和 获取 客户 交易 行为 、 
对 相关 网 络 数 据 进行 关联 分 析 ， 找 寻 数 据 背 后 风险 与 成 本 、 收 益 的 匹配 规律 ， 进 而 推动 保 
险 公司 客户 细 分 化 、 责 任 碎片 化 、 产 品 定制 化 ， 优 化 精算 定价 模型 ， 从 而 建立 科学 、 有 效 
的 保险 费 率 浮动 机 制 和 差别 化 定价 机 制 。 
因此 ， 大 数据 并 没有 颠覆 大 数 法 则 ， 而 是 对 市 场 化 保险 费 率 形 成 机 制 的 重要 优化 和 改 
进 ， 是 一 种 以 新 技术 为 依托 、 更 加 精细 化 的 风险 管理 辅助 工具 。 


2. 大 数据 与 传统 保险 精算 理论 


保险 作为 经 营 风险 的 学 科 ， 其 运行 的 关键 在 于 精算 。 在 传统 精算 理论 中 ， 精 算 师 通过 
运用 大 数 法 则 对 其 所 掌握 的 风险 暴露 数据 进行 建 模 和 分 析 ， 从 中 找 出 该 项 风险 发 生 的 规 
律 ， 并 在 一 定 的 假设 条 件 下 对 未 来 风险 发 生 的 可 能 性 以 及 所 造成 的 损失 大 小 做 出 判断 ， 进 
而 基于 这 些 判断 设 计 相应 的 保险 产品 。 

在 大 数据 应 用 的 背景 下 ， 精 算 师 可 以 利用 大 数据 分 析 技 术 对 其 所 掌握 的 海量 数据 进行 
回归 分 析 ， 进 而 精准 地 识别 出 具体 某 一 客户 的 潜在 风险 ， 而 不 再 是 对 具有 相似 特征 的 某 一 
类 型 客户 群 的 潜在 风险 进行 判断 。 虽 然 二 者 在 思维 模式 上 有 很 大 的 不 同 ， 但 大 数据 并 没有 
颠覆 传统 精算 理论 ， 而 是 作为 一 项 辅助 工具 与 传统 精算 方法 相 融 合 ， 进 而 衍生 出 更 加 优化 
的 保险 精算 方法 。 
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5.2.2 ”大 数据 对 承保 定价 的 革新 
1. 丰富 风险 特征 的 描述 


在 传统 的 保险 定价 方式 中 ， 精 算 师 利用 到 的 数据 仅 限 于 保险 行业 中 的 数据 ， 甚 至 仅 为 
保险 公司 的 内 部 风险 数据 。 在 当前 感知 更 加 透彻 、 互 联 互 通 更 加 全 面 、 智 能 化 更 加 深入 的 
大 数据 时 代 ， 大 数据 技术 将 帮助 保险 公司 获取 到 丰富 的 风险 特征 描述 ， 进 而 助 其 在 承保 定 
价 方面 实现 革命 性 的 创新 。 

1) “从 样本 数据 到 全 量 数据 

保险 精算 是 基于 一 定量 的 数据 实现 的 。 在 传统 的 保险 精算 中 ， 假 设 通 过 抽样 所 选取 的 
样本 是 能 够 充分 反映 被 调查 群体 特征 的 ， 但 鉴于 技术 和 操作 层面 所 存在 问题 ， 基 于 样本 的 
判断 往往 不 尽 如 人 意 。 而 在 当前 的 大 数据 时 代 ， 保 险 公 司 可 以 充分 地 利用 依靠 大 数据 技术 
所 获取 的 全 量 数据 ， 从 而 使 保险 精算 更 加 准确 。 

2) ”从 内 部 数据 到 外 部 数据 

一 直 以 来 ， 保 险 精算 所 利用 的 数据 大 多 都 是 保险 行业 的 内 部 数据 ， 包 括 基 于 承保 的 风 
险 数据 和 基于 理赔 的 损失 数据 。 传 统 保险 精算 就 是 在 这 些 数据 基础 上 进行 分 析 建 模 从 而 对 
保险 产品 进行 定价 的 ， 但 就 单独 的 风险 个 体 来 看 ， 这 些 内 部 数据 根本 不 足以 刻画 其 个 体 风 
险 。 而 在 大 数据 技术 的 应 用 下 ， 被 引入 的 外 部 数据 能 够 充分 地 丰富 风险 刻画 的 维度 ， 并 将 
会 在 保险 公司 的 承保 定价 中 发 挥 更 加 重要 的 作用 。 

3) ”从 历史 数据 到 实时 数据 

在 传统 的 保险 精算 中 所 利用 的 数据 大 多 是 历史 数据 ， 由 于 这 些 历史 数据 缺乏 时 效 性 ， 
在 其 基础 上 所 进行 的 保险 精算 并 不 能 很 好 地 满足 预测 和 定价 的 需求 。 例 如 ， 我 国 的 寿险 业 
在 过 去 一 直 使 用 的 是 日 本 1965 年 数据 编制 的 生命 表 ， 显 然 与 我 国 的 实际 情况 存在 较 大 的 
差距 。 而 在 大 数据 技术 的 应 用 下 ， 保 险 公司 可 以 实时 地 获取 与 保险 经 营 相 关 的 数据 ， 从 而 
实现 更 加 精准 的 风险 预测 和 定价 。 

4) ”从 数据 数量 、 质 量 到 维度 

在 大 数据 技术 应 用 以 前 ， 人 们 在 进行 保险 精算 时 通常 都 希望 获取 尽 可 能 大 的 数据 量 并 
重视 数据 质量 的 把 控 工 作 。 而 在 当前 的 大 数据 时 代 ， 数 据 的 数量 和 质量 不 再 是 数据 工作 的 
关注 焦点 ， 因 为 大 数据 技术 填补 了 过 去 数据 维度 有 限 的 不 足 ， 使 数据 维度 得 到 了 极 大 程度 
的 丰富 。 保 险 精 算 也 将 会 把 工作 重点 转移 到 利用 多 维度 数据 更 好 地 刻画 客户 中 来 。 

5) ”从 因果 关系 到 相对 关系 

传统 的 保险 精算 是 基于 因果 关系 对 历史 数据 进行 聚 类 和 归 因 分 析 ， 进 而 对 未 来 的 发 展 
趋势 进行 预测 和 判断 的 。 由 于 未 来 是 由 未 来 的 环境 所 决定 的 ， 这 种 用 历史 去 预测 未 来 的 方 
法 本 身 就 具有 一 定 的 局 限 性 。 而 在 大 数据 技术 的 应 用 下 ， 人 们 可 以 基于 多 维度 数据 与 某 一 
风险 事件 之 间 的 相对 关系 ， 利 用 实时 的 多 维度 数据 对 未 来 进行 分 析 和 预测 。 

2. 改变 风险 定价 的 模式 


保险 公司 的 承保 定价 能 力 是 其 在 同业 竞争 中 的 核心 竞争 力 。 但 一 直 以 来 ， 保 险 公 司 对 
其 保险 产品 所 实行 的 是 统一 定价 原则 ， 很 难 对 客户 形成 吸引 力 。 在 大 数据 技术 的 应 用 下 ， 
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保险 公司 过 去 的 样本 精算 将 升级 为 全 量 精算 ， 风 险 定价 模式 将 发 生 很 大 的 改变 。 通 过 应 用 
大 数据 技术 ， 传 统 的 保险 精算 中 将 引入 更 多 的 定价 因素 ， 保 险 公 司 能 够 根据 客户 的 特定 风 
险 来 调整 承保 定价 ， 不 仅 能 够 使 客户 的 差异 化 需求 得 到 满足 ， 还 能 使 保险 公司 的 承保 风险 
得 到 降低 ， 从 而 达到 客户 和 保险 公司 双方 共 赢 的 目的 。 

1) ”增加 更 多 的 辅助 定价 因素 

将 大 数据 技术 应 用 于 承保 定价 ， 能 够 在 其 传统 的 保险 产品 中 增加 更 多 的 辅助 定价 因 
素 ， 进 而 帮助 保险 公司 实现 对 特定 客户 的 个 性 化 风险 定价 。 大 数据 技术 在 承保 定价 中 的 作 
用 目前 在 车 险 和 健康 险 中 均 有 所 体现 。 

在 车 险 领域 ， 基 于 使 用 的 定价 模式 已 逐渐 被 保险 公司 运用 在 产品 创新 中 。 除 了 获得 相 
关 的 车 型 数据 、 汽 车 零 整 比 数据 、 二 手 车 数据 以 外 ， 保 险 公司 还 通过 与 4S 店 合作 获取 车 
辆 的 保修 、 保 养 数据 ， 通 过 使 用 车 载 传 感 设备 收集 驾驶 员 的 行驶 路 线 和 驾驶 习惯 数据 ， 进 
而 开发 出 基于 使 用 的 车 险 计划 (UBI，Usage Based Insurance)。 在 健康 险 领域 ， 保 险 公司 通 
过 与 医院 合作 掌握 客户 的 健康 记录 、 就 诊 记录 、 体 测 指标 、 体 检 报 告 ， 甚 至 是 家 庭 主 要 成 
员 的 医疗 记录 ， 通 过 利用 可 穿戴 设备 (如 : Jawbone 推出 的 Up、Apple 推出 的 HealthKit) 能 
够 实时 监控 客户 的 健康 情况 (如 运动 量 、 睡 卢 、 心 跳 等 ) 和 生活 习惯 ， 以 弥补 生命 表 对 具体 
的 某 一 客户 个 体 的 健康 状况 和 生死 概率 的 判断 能 力 之 不 足 。 

2) ”根据 客户 行为 的 变化 进行 调整 

此 外 ， 保 险 产 品 的 定价 调整 和 客户 行为 也 是 相辅相成 的 ， 即 保险 产品 的 定价 是 根据 客 
户 行为 的 变化 进行 调整 的 。 退 货运 费 险 的 定价 模式 调整 就 是 典型 的 例子 。 

华泰 保险 于 2010 年 和 电 商 平台 淘宝 合作 ， 针 对 消费 者 网 上 购物 所 面临 的 退货 风险 推 
出 了 退货 运费 险 。 但 该 退货 运费 险 在 推出 后 所 产生 的 直接 赔付 率 曾 一 度 高 达 93%， 其 基于 
客户 历史 退货 情况 的 产品 定价 系统 也 被 怀疑 是 错误 的 。 而 造成 的 这 一 现象 的 原因 在 于 ， 消 
费 者 在 购买 退货 运费 险 后 其 退货 行为 变 得 更 加 随意 ， 只 要 有 丝毫 的 不 满意 都 会 选择 退回 其 
所 购物 品 。 因 此 ， 华 泰 保险 对 其 退货 运费 险 的 定价 系统 进行 了 调整 ， 将 包括 商品 种 类 和 商 
户 的 阶段 性 销售 数据 等 更 多 的 定价 因素 纳入 其 定价 系统 中 ， 进 而 综合 若干 数据 模型 来 预测 
消费 者 发 生 退货 行为 的 概率 。 

从 中 我 们 可 以 看 出 ， 基 于 大 数据 技术 和 全 局 数据 的 保险 产品 定价 模式 可 以 帮助 保险 公 
司 在 了 解 客户 特点 的 基础 上 ， 设 计 出 满足 客户 具体 保险 需求 且 具 有 较 低 风险 概率 和 较 高 收 
益 的 保险 产品 ， 进 而 使 保险 公司 在 产品 收益 、 客 户 体验 、 风 险 管理 等 方面 获得 优势 。 


3. 大 数据 助力 保险 费 率 的 市 场 化 改革 


目前 ， 保 险 费 率 形成 机 制 的 市 场 化 改革 进程 在 不 断 加 快 ， 意 外 险 、 投 资 连 接 险 、 普 通 
型 寿险 、 万 能 险 和 非 车 险 等 相关 领域 的 费 率 市 场 化 定价 已 相继 放 开 ， 商 业 车 险 、 分 红 险 的 
费 率 市 场 化 定价 也 即将 发 令 放 行 ， 在 未 来 将 有 更 多 保险 产品 的 定价 权 交 给 高 效 的 市 场 。 保 
险 费 率 市 场 化 改革 的 关键 在 于 费 率 形成 机 制 是 科学 且 有 效 的 。 因 而 在 大 数据 技术 的 应 用 背 
景 下 ， 在 基于 大 数 法 则 确定 保险 产品 基准 费 率 的 基础 上 ， 运 用 大 数据 技术 为 保险 产品 的 附 
加 费 率 进行 定价 。 

一 方面 ， 应 由 保险 监管 部 门 主导 构建 起 公开 公正 的 保险 基准 费 率 形成 机 制 ， 并 同时 建 
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立 保险 基准 费 率 定期 测算 和 发 布 机制 ， 特 别 是 通过 借鉴 国际 上 的 成 熟 经 验 和 模式 ， 设 立 独 
立 的 保险 费 率 厘定 机 构 ， 进 而 形成 主要 保险 产品 的 定价 参照 基准 体系 。 另 一 方面 ， 要 鼓励 
保险 企业 在 遵循 基准 费 率 的 同时 ， 发 挥 大 数据 技术 在 保险 产品 区 域 化 创新 、 差 异化 创新 和 
个 性 化 创新 方面 的 支撑 作用 ， 最 大 限度 地 处 理 好 保险 产品 创新 与 其 风险 和 收益 间 的 关系 。 


5.2.3 ”大 数据 在 车 险 定价 中 的 应 用 


车 险 保费 的 高 低 一 直 是 车 主 最 关心 的 话题 。 在 大 数据 技术 应 用 以 前 ， 不 论 客户 驾驶 行 
为 的 好 坏 ， 车 险 保费 的 价格 基本 相当 。 而 随 着 大 数据 技术 在 保险 行业 的 广泛 应 用 ， 过 去 优 
质 车 主 为 高 风险 车 主 买单 的 现象 将 不 再 出 现 ， 基 于 车 主 驾 驶 行为 的 保费 定价 模式 也 将 使 传 
统 车 险 的 定价 模式 被 完全 颠覆 。 


1. 车 险 费 率 厘定 的 基本 模式 


通常 保险 公司 在 为 车 险 费 率 进行 定价 时 主要 参考 两 类 风险 因素 : 第 一 类 是 与 机 动车 辆 
相关 的 风险 因素 ， 包 括 品牌 、 购 买 价格 、 使 用 情况 等 方面 ,第 二 类 是 与 车 主 相关 的 风险 因 
素 ， 包 括 车 主 的 年 龄 、 婚 姻 状况 、 职 业 、 驾 驶 行为 等 方面 。 因 而 我 们 可 以 将 车 险 费 率 的 定 
价 模式 划分 为 从 车 定价 模式 和 从 人 定价 模式 。 

1) “从 车 定价 模式 

在 从 车 定价 模式 中 ， 保 险 公 司 在 为 投保 车 辆 进行 保费 厘定 时 ， 只 考虑 与 该 投保 车 辆 相 
关 的 风险 因素 。 这 些 风险 因素 包括 但 不 限于 : 

(1) 投保 车 辆 的 种 类 : 可 分 为 客车 、 货 车 、 摩 托 车 、 专 用 车 和 拖拉 机 

(2) 投保 车 辆 的 产地 : 可 分 为 国产 车 和 进口 车 ; 

(3) 投保 车 辆 的 使 用 性 质 : 可 分 为 营业 性 和 非 营业 性 ; 

(4) 投保 车 辆 的 行驶 区 域 : 不 同 区 域 的 车 辆 在 车 险 费 率 厘定 时 也 有 所 不 同 。 

目前 ， 我 国 车 险 费 率 厘 定 主要 采用 的 就 是 从 车 定价 模式 。 该 模式 具有 操作 简单 的 特 
点 ， 但 未 考虑 与 车 主 相关 的 风险 因素 。 

2) 从 人 定价 模式 

在 从 人 定价 模式 中 ， 保 险 公 司 在 为 投保 车 辆 进行 保费 厘定 时 ， 主 要 考虑 与 该 投保 车 辆 
的 车 主 相关 的 风险 因素 。 这 些 风险 因素 包括 但 不 限于 : 

(1) 车 主 的 性 别 : 包括 男性 和 女性 ; 

(2) 车 主 的 年 龄 层次 : 可 分 为 青年 人 、 中 年 人 和 老年 人 ; 

(3) 车 主 的 驾龄 : 可 分 为 首次 领取 驾驶 证 后 不 足 3 年 和 首次 领取 驾驶 证 后 超过 3 年 ; 

(4) 车 主 的 驾驶 行为 :可 分 为 安全 、 较 安全 、 一 般 、 较 危险 和 人 危险 。 

其 中 关于 车 主 驾 驶 行为 是 依据 车 主 在 日 常 驾驶 中 的 具体 驾驶 行为 数据 进行 综合 判定 而 
来 的 。 从 历史 统计 数据 中 来 看 ， 女 性 车 主 的 驾驶 风险 要 低 于 男性 车 主 ， 中 年 车 主 由 于 具有 
一 定 的 驾驶 经 验 和 较为 良好 的 身体 状态 ， 其 驾驶 风险 要 低 于 老年 车 主 和 青年 车 主 ， 首 次 领 
取 驾 驶 证 不 足 3 年 的 新 手 车 主 的 驾驶 风险 高 于 领取 驾驶 证 超过 3 年 的 车 主 ; 而 具有 良好 驾 
驶 行为 和 习惯 的 车 主 的 驾驶 风险 要 低 于 驾驶 行为 较 差 的 车 主 。 从 人 定价 模式 更 加 强调 车 主 
自身 的 风险 特征 ， 在 定价 时 更 加 强调 个 性 化 。 
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2. OBD 和 UBI 车险 


1) ”OBD 与 车 险 费 率 厘定 

OBD (On-Board Diagnostics) 即 车 载 自动 诊断 系统 ， 是 能 够 测度 和 读 取 机 动车 辆 的 运行 
参数 ， 具 有 车 辆 检测 、 维 护 、 管 理 等 功能 的 程序 系统 。OBD 系统 能 够 读 取 机 动车 辆 发 动 
机 、 变 动 箱 和 ABS 等 的 故障 码 ， 再 通过 小 型 的 车 载 通信 设备 (GPS 导航 仪 或 者 无 线 通信 等 ) 
将 机 动车 辆 的 基本 信息 、 所 在 位 置 或 者 故障 码 等 自动 上 传 到 管理 平台 或 设备 上 。 

OBD 系统 又 被 称 为 OBD 盒子 ， 在 将 OBD 设备 插入 到 机 动车 辆 上 的 OBD 插口 之 后 ， 
该 设备 就 能 对 所 检测 机 动车 辆 的 行驶 里 程 、 油 耗 、 发 动机 转速 、 故 障 情况 等 数据 信息 进行 
读 取 和 分 析 ， 进 而 将 所 分 析出 的 该 机 动车 辆 的 车 辆 状况 以 及 驾驶 员 的 行为 习惯 上 传 到 管理 
后 台 上 。 保 险 公司 可 以 充分 利用 OBD 系统 的 车 辆 信息 获取 、 分 析 和 传输 功能 ， 了 解 车 主 
的 具体 驾驶 行为 和 习惯 ， 对 车 主 的 驾驶 风险 做 出 精准 的 判断 ， 从 而 为 车 主 提供 基于 其 真实 
驾驶 行为 的 个 性 化 车 险 费 率 厘 定 。 

保险 公司 利用 OBD 系统 进行 车 险 费 率 厘定 的 数据 处 理 流程 如 图 5.5 所 示 。 


汽车 总 线 ，CAN、 
区 等 


车 辆 行驶 数据 
车 险 风 险 模型 


图 5.5 基于 OBD 系统 的 车 险 费 率 厘定 


在 基于 OBD 系统 厘定 车 险 费 率 的 数据 处 理 流程 中 ， 车 辆 行驶 数据 的 采集 和 分 析 过 程 
主要 由 车 载 终端 、 采 控 网 关 和 管理 平台 3 个 部 分 组 成 。 其 中 ，QD 车 载 终端 包括 GPS、CAN 
总 线 的 数据 采集 分 析 、 可 视 倒车 、 硬 盘 MP5 播放 和 录像 、GPRS 无 线 数据 传输 等 功能 。 
@ 采 控 网 关 介 于 硬件 终端 和 上 层 分 析 软 件 之 间 ， 具 有 海量 存储 、 平 衡 负载 、 信 息 交 互 和 预 
处 理 等 功能 。@ 管 理 平台 一 般 进 行 数据 的 挖掘 、 清 洗 以 及 报表 的 生成 ， 具 体 包括 安全 管理 
和 节能 管理 等 ， 其 中 安全 管理 工作 包括 远程 故障 、 不 良 驾驶 行为 以 及 车 辆 部 件 预警 等 的 诊 
断 ， 而 节能 管理 工作 包括 驾驶 行为 分 析 、 和 车辆 油耗 分 析 、 车 险 匹 配 分 析 以 及 单车 运行 分 析 
等 ， 此 外 还 设计 车 辆 身份 信息 以 及 一 键 呼叫 等 功能 。 因 此 ， 一 般 利用 OBD 系统 收集 的 数 


保单 理赔 
数据 
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据 主要 包括 超速 报警 、 不 良 驾驶 行为 记录 ( 急 刹 车 、 急 减速 、 急 加 速 等 )、 未 打转 向 灯 转 这 
记录 、 疲 劳 驾驶 管理 、 出 险 报警 、 偷 油 报警 等 。 

2) ”UBI 与 车 险 费 率 厘 定 

UBI(Usage Based Insurance) 是 指 基 于 机 动车 辆 驾驶 人 驾驶 行为 状况 进行 个 性 化 保费 率 
厘定 的 车 险 。 在 UBI 车 险 中 ， 保 险 公 司 将 根据 实时 监测 并 获取 的 与 驾驶 人 驾驶 行为 和 习惯 
相关 的 各 项 数据 ， 通 过 分 析 和 挖掘 进而 对 该 投保 车 辆 的 驾驶 人 风险 程度 进行 判断 ， 并 将 该 
风险 判断 的 结果 应 用 于 车 险 费 率 的 厘定 之 中 一 一 根据 驾驶 行为 安全 性 的 不 同 ， 对 拥有 安全 
驾驶 行为 的 投保 人 给 予 与 其 风险 程度 相 匹 配 的 保费 优惠 ， 而 对 具有 人 危险 驾驶 行为 的 投保 人 
收取 更 多 与 其 风险 程度 相 匹 配 的 保费 。 在 UBI 车 险 定价 中 ， 与 驾驶 人 驾驶 行为 相关 的 数据 
是 通过 安装 在 机 动车 辆 上 的 OBD 设备 获取 的 。 

UBI 车 险 的 应 用 能 够 给 投保 人 、 保 险 公司 及 公共 安全 带 来 益处 。 

对 投保 人 的 益处 有 以 下 几 个 方面 。 

(1) UBI 车 险 能 够 为 投保 人 提供 更 加 公平 合理 的 车 险 费 率 。 尤 其 是 对 拥有 安全 驾驶 行 
为 的 投保 人 而 言 ， 能 够 有 效 地 降低 其 保险 支出 的 负担 。 

(2) UBI 车 险 能 够 帮助 驾驶 人 形成 良好 的 驾驶 行为 习惯 。 

(3) 基于 OBD 设备 的 使 用 驾驶 人 可 以 及 时 地 了 解 车 况 并 主动 地 控制 风险 。 

对 保险 公司 的 益处 有 以 下 几 个 方面 。 

(1) UBI 车 险 使 保险 公司 的 车 险 费 率 厘定 更 加 科学 准确 ， 使 其 客户 满意 度 和 市 场 影响 
力 得 到 有 效 的 提高 ， 为 其 提供 了 更 多 的 增值 效益 。 

(2) 保险 公司 在 UBI 车 险 中 能 够 对 投保 车 辆 可 能 发 生 的 风险 进行 实时 的 动态 监控 ， 准 
确 了 解 投保 车 辆 的 车 况 ， 从 而 在 赔付 环节 做 出 合理 的 赔付 ， 理 赔 效 率 得 到 有 效 提升 。 

(3) 基于 OBD 设备 在 投保 车 辆 上 的 使 用 ， 保 险 公司 的 赔付 成 本 也 能 得 到 有 效 地 降 
低 ， 进 而 实现 其 经 营利 润 的 增加 。 

而 就 社会 公共 安全 方面 来 说 ，UBI 车 险 产品 的 推出 和 使 用 能 够 在 一 定 程度 上 降低 交通 
事故 发 生 的 可 能 性 ， 有 利于 社会 公共 安全 的 维护 。 

目前 ， 我 国保 险 市 场 还 没有 正式 推出 UBI 车 险 产品 ， 但 UBI 车 险 产品 已 经 在 许多 国 
家 的 保险 市 场 上 出 现 。 在 美国 车 险 市 场 上 ， 出 现 了 基于 驾驶 里 程 进行 车 险 费 率 厘定 的 
Metronome 项 目 、 基 于 驾驶 行为 表现 (包括 总 驾驶 里 程 、 日 驾驶 里 程 、 急 刹车 次 数 和 时 速 超 
过 80 英里 /小 时 的 次 数 等 数据 指标 ) 进 行车 险 费 率 厘定 的 Allstate 项 目 等 UBI 车 险 产 品 项 
目 。 在 欧洲 车 险 市 场 上 ， 也 逐渐 出 现 了 针对 高 保费 群体 的 车 险 UBI 项 目 和 基于 良好 驾驶 行 
为 给 予 投保 人 一 定 车 险 费 率 折扣 的 UBI 车 险 产 品 。 

3. 基于 OBD+UBI 的 车 险 费 率 厘定 

基于 OBD+UBI 的 车 险 费 率 厘定 方法 就 是 以 驾驶 人 驾驶 行为 为 基础 ， 根 据 驾 驶 人 的 不 
同 风险 程度 确定 特定 投保 人 保费 水 平 的 差别 化 车 险 保费 厘定 方法 。 

1) “从 车 + 从 人 ”的 定价 模式 

OBD 设备 与 UBI 车 险 相 结合 ， 可 以 基于 投保 车 辆 的 车 辆 状况 以 及 驾驶 人 的 驾驶 行为 
习惯 对 投保 人 的 车 险 需求 进行 风险 判断 ， 进 而 为 风险 不 同 的 投保 人 厘定 不 同 的 车 险 费 率 。 
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具体 来 讲 ， 在 这 一 模式 下 保险 公司 为 确定 某 个 具体 投保 人 的 驾驶 风险 程度 ， 利 用 OBD 
系统 所 能 收集 的 相关 数据 包括 : 能 够 反映 车 辆 状况 的 车 辆 行驶 区 域 、 总 行驶 里 程 、 日 行驶 
里 程 、 发 动机 状态 等 相关 数据 ， 以 及 能 够 反映 驾驶 人 驾驶 行为 习惯 的 急 刹 车 次 数 、 急 加 速 
次 数 、 急 减速 次 数 等 相关 数据 。 在 获取 数据 的 基础 上 ，OBD 系统 能 对 该 投保 人 车 险 需求 的 
风险 程度 进行 量化 评判 ， 一 般 评分 越 高 该 投保 人 的 风险 程度 越 低 : 反之 ， 评 分 越 低 该 投保 
人 的 风险 程度 就 越 高 。 

保险 公司 在 对 投保 人 的 车 险 需求 进行 费 率 厘定 时 ， 除 了 要 考虑 利用 OBD 系统 所 获取 
的 变动 数据 外 ， 还 会 考虑 到 与 投保 车 辆 和 驾驶 人 相关 的 一 些 不 变 因素 。 这 些 不 变 因 素 包括 
投保 车 辆 的 品牌 、 车 型 、 出 产地 、 购 置 价格 、 车 龄 等 因素 ， 以 及 驾驶 人 的 年 龄 、 驾 龄 、 性 
别 、 健 康 状 况 等 因素 。 将 不 变 因素 与 可 变 因素 相 结合 、 既 从 车 又 从 人 的 车 险 定价 方式 相 较 
于 传统 的 车 险 费 率 厘定 方式 更 加 科学 合理 。 

2) “车 险 费 率 的 厘定 方法 

基于 OBD+UBI 的 车 险 费 率 主要 是 由 基础 费 率 和 附加 费 率 两 部 分 共同 构成 的 。 

基础 费 率 的 厘定 主要 是 通过 采用 传统 的 费 率 厘定 方法 来 实现 的 。 在 该 厘定 方法 下 对 投 
保 人 进行 相关 风险 的 判断 ， 所 考虑 的 是 与 投保 车 辆 和 驾驶 人 相关 的 不 变 因 素 ， 即 通过 对 投 
保 车 辆 的 品牌 、 车 型 、 出 产地 、 购 置 价格 、 车 龄 以 及 驾驶 人 的 年 龄 、 驾 龄 、 性 别 、 健 康 状 
况 等 因素 进行 交叉 分 类 ， 进 而 确定 出 该 投保 人 的 基础 费 率 。 

而 附加 费 率 的 厘定 主要 是 通过 利用 内 含 大 数据 技术 的 OBD 系统 对 驾驶 人 的 驾驶 行为 
和 习惯 给 出 的 分 数 ， 来 确定 该 投保 人 应 缴纳 的 车 险 附加 费 率 。 一 般 评分 越 高 所 需 缴纳 的 附 
加 费 率 就 越 低 ， 反之， 评分 越 低 所 需 缴纳 的 附加 费 率 就 越 高 。 

在 借助 大 量 的 数据 和 车 险 精算 模型 厘定 出 投保 人 的 基础 费 率 和 附加 费 率 之 后 ， 保 险 公 
司 根据 其 所 赋予 车 险 基础 费 率 和 附加 费 率 的 不 同 权 重 ， 计 算出 该 投保 人 应 缴纳 的 车 险 
费 率 。 

3) ”车 险 保费 的 支付 方式 

目前 我 国保 险 业 还 没有 出 现 基于 OBD 和 UBI 的 车 险 产品 。 因 此 ， 由 于 缺少 相当 数量 
的 驾驶 人 驾驶 行为 数据 和 评分 数据 ， 在 该 模式 下 的 车 险 保费 支付 方式 应 当 采 用 期 初 预付 当 
期 保费 、 期 末 根 据 投保 人 相关 风险 状况 多 退 少 补 的 保费 支付 方式 。 

在 该 支付 方式 的 具体 实施 过 程 中 ， 保 险 公司 会 在 投保 人 的 投保 首 期 以 一 定 的 费 率 优惠 
鼓励 投保 人 在 其 投保 车 辆 上 安装 OBD 设备 ， 并 根据 传统 车 险 费 率 厘 定 方式 来 确定 投保 人 
应 缴纳 的 保费 。 之 后 保险 公司 根据 其 利用 OBD 系统 对 整个 投保 期 内 投保 人 驾驶 行为 风险 
的 判断 ， 通 过 保险 精算 模型 计算 出 该 投保 人 的 基础 费 率 和 附加 费 率 ， 进 而 在 给 定 权 重 的 基 
础 上 计算 出 该 投保 人 实际 应 缴纳 的 保费 。 若 该 实际 应 缴 保费 少 于 投保 人 期 初 已 缴 保 费 ， 保 
险 公司 将 向 该 投保 人 退还 多 收取 的 保费 ; 反之 ， 则 由 投保 人 补足 差额 部 分 。 而 在 之 后 各 期 
的 期 初 ， 保 险 公 司 将 根据 上 期 投保 人 所 实际 缴纳 的 保费 预收 当期 保费 ， 并 根据 相同 方法 在 
期 末 进 行 多 退 少 补 。 


5.2.4 ”大 数据 在 健康 险 定价 中 的 应 用 
随 着 人 口 老龄 化 加 速 现象 的 出 现 ， 我 国 所 面临 的 健康 和 养老 挑战 越 来 越 严 峻 。 虽 然 我 
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国 已 经 初步 建立 了 基本 养老 、 基 本 医疗 等 社会 保障 制度 ， 但 相关 投入 仍然 有 很 大 的 不 足 ， 
保障 水 平 依然 有 限 。 据 有 关 部 门 预测 ， 我 国 健康 服务 业 的 规模 将 在 2020 年 突破 8 万 亿 
元 ， 健 康 和 养老 服务 将 成 为 未 来 新 的 经 济 增长 点 。 随 着 政策 的 不 断 推 动 以 及 市 场 上 健康 服务 
需求 的 进一步 释放 ， 商 业 健康 保险 将 会 成 为 我 国医 疗 保障 系统 中 不 可 或 缺 的 重要 组 成 部 分 。 

我 国 健康 险 的 发 展 起 步 较 晚 ， 相 对 于 人 体 生理 健康 变化 的 周期 显得 较为 短暂 ， 因 而 我 
国保 险 业 对 于 疾病 发 生 率 、 医 疗 费用 支出 率 等 医疗 数据 的 历史 积累 较为 薄弱 。 

就 医疗 信息 数据 的 利用 来 看 ， 国 家 层面 的 人 口 健康 数据 应 用 平台 尚未 建立 ， 省 级 层面 
的 人 口 健康 信息 平台 虽然 已 陆续 开始 建设 但 仅 限于 卫生 系统 内 部 使 用 ， 保 险 业内 也 尚未 建 
立 医 疗 信息 数据 的 共享 系统 ， 与 保单 相关 的 大 量 医 疗 信息 只 记录 在 病历 和 赔付 档案 里 。 从 
中 可 以 看 出 我 国医 疗 信息 数据 的 利用 程度 较 低 。 

这 一 系列 数据 运用 的 问题 导致 我 国 健康 险 产 品 存在 设计 不 科学 、 定 价 不 精准 、 获 客 困 
难 、 医 疗 费用 难 管理 、 道 德 风 险 和 骗 保 现象 时 有 发 生 的 问题 ， 而 大 数据 技术 的 应 用 能 够 有 
效 地 解决 上 述 问题 。 下 面 主要 对 大 数据 在 健康 险 定价 中 的 应 用 进行 介绍 ， 大 数据 在 健康 险 
精准 营销 和 欺诈 识别 中 的 应 用 将 在 之 后 的 小 节 中 进行 介绍 。 


1. 医疗 大 数据 


目前 我 国 的 商业 健康 险 可 分 为 团体 险 和 个 人 险 两 种 。 其 中 ， 在 个 人 险 产 品 中 ， 大 部 分 
是 储蓄 理财 型 健康 险 ， 而 真正 意义 上 的 健康 险 一 消费 理赔 型 健康 险 只 占 很 少 的 一 部 分 。 
而 导致 这 一 现象 出 现 的 原因 就 在 于 我 国 的 保险 公司 对 相关 医疗 费用 的 估算 和 控制 能 力 十 分 
有 限 ， 且 缺乏 对 相关 健康 险 进行 精算 定价 的 数据 依据 ， 从 而 使 消费 理赔 型 健康 险 的 设计 开 
发 较为 困难 。 

例如 ， 对 于 肿瘤 类 的 大 病 保险 ， 政 府 医保 基于 保 基本 原则 只 能 支付 其 治疗 费用 中 的 一 
部 分 ， 且 报销 范围 不 涵盖 当前 市 场 上 治疗 效果 显著 但 价格 昂贵 的 诅 向 性 生物 试剂 ， 使 肿瘤 
患者 及 其 家 庭 面 临 着 较 大 的 治疗 负担 。 对 于 这 一 保险 市 场 中 的 空白 ， 虽然 有 许多 保险 看 好 
这 一 市 场 机 会 ， 但 碍 于 其 无 法 准确 掌握 治疗 肿瘤 疾病 的 实际 医疗 费用 进而 对 该 保险 产品 进 
行 合理 定价 ， 只 能 对 该 市 场 机 会 望而却步 。 

1) ”我 国 的 医疗 信息 化 建设 

2014 年 国家 卫 计 委 提 出 中 国 卫 生 信息 化 建设 的 顶层 设计 规划 一 一 “4631 一 2 工程 ”。 

该 工程 由 以 下 几 个 部 分 组 成 。 

(1) “4” 代 表 4 级 卫生 信息 平台 ， 分 别 为 国家 级 人 口 健康 管理 平台 、 省 级 人 口 健康 
信息 平台 、 地 市 级 人 口 健康 区 域 信息 平台 以 及 区 县 级 人 口 健康 区 域 信息 平台 。 

(2) “6” 代 表 6 项 业务 应 用 ， 分 别 为 公共 卫生 、 医 疗 服务 、 医 疗 保障 、 药 品 管理 、 
计划 生育 和 综合 管理 。 

(3) “3” 代 表 3 个 基础 数据 库 ， 分 别 为 电子 健康 档案 数据 库 、 电 子 病历 数据 库 和 全 
员 人 口 个 案 数 据 库 。 

(4) “1” 代 表 1 个 融合 网 络 ， 即 人 口 健康 统一 网 络 。 

(5) “2” 代 表 2 个 信息 体系 ， 即 人 口 健康 信息 标准 体系 和 信息 安全 防护 体系 。 

(6) 相关 医疗 信息 的 来 源 包 括 : 基于 电子 病历 的 医院 信息 系统 、 基 层 医 疗 卫生 管理 信 
息 系统 、 医 疗 健康 公共 服务 系统 和 计划 生育 信息 系统 。 
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从 中 我 们 可 以 看 出 ，“4631 一 2 工程 ”是 致力 于 打造 全 方位 、 立 体 化 的 国家 医疗 卫生 
信息 资源 体系 的 国家 顶层 设计 规划 。 该 工程 一 经 建成 并 投入 使 用 将 会 使 我 国医 疗 大 数据 巨 
大 的 使 用 价值 得 到 充分 的 发 挥 和 体现 ， 如 图 5.6 所 示 。 


5.6 4631 一 2 工程 


2) “医疗 数据 库 体系 

在 卫 计 委 “4631 一 2 工程 ”的 3 个 基础 数据 库 一 一 电子 健康 档案 数据 库 、 电子 病历 
数据 库 和 全 员 人 口 个 案 数 据 库 中 ， 电 子 健康 档案 数据 库 和 电子 病历 数据 库 是 最 为 基础 和 重 
要 的 医疗 信息 数据 库 ， 如 图 5.7 所 示 。 

(1) 医院 是 医疗 大 数据 获取 的 关键 来 源 。 

据 有 关 数 据 显示 ， 近 80% 的 药品 销售 是 在 医院 中 实现 的 ， 而 患者 接受 医疗 服务 的 过 程 
是 在 医院 中 进行 的 ， 医 保 消费 的 支出 也 主要 配置 于 医院 之 中 。 从 而 可 以 看 出 ， 与 个 人 相关 
的 医药 、 医 疗 和 医保 数据 都 主要 汇集 于 医院 之 中 ， 医 院 是 医疗 大 数据 获取 的 关键 来 源 。 

电子 病历 是 医院 信息 平台 的 核心 ， 因 而 电子 病历 系统 是 医院 信息 系统 中 最 为 重要 的 医 
疗 数 据 系 统 。 

(2) 居民 健康 档案 是 个 人 健康 数据 存储 的 主要 渠道 。 

居民 健康 档案 中 所 存储 的 相关 数据 如 图 5.8 所 示 。 
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卫生 服务 对 象 卫生 服务 提供 者 ] 卫生 服务 管理 者 】 其 他 领域 与 行业 


数据 资源 有 
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电子 病历 基于 CDA 
文档 案 的 文档 
数据 资源 采集 层 


医院 信息 平台 卫生 机 构 业 务 系统 


图 5.7 医疗 数据 库 体 系 
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图 5.8 居民 健康 档案 中 存储 的 数据 


159, 


Lunaasitn 


居民 健康 档案 是 区 域 医疗 信息 平台 的 核心 ， 其 中 所 存储 的 数据 不 仅 包括 与 居民 个 人 相 
关 的 电子 病历 数据 ， 同 时 还 包括 个 人 的 公共 卫生 信息 。 个 人 的 基本 信息 、 主 要 就 诊 医院 和 
相关 健康 问题 摘要 以 及 其 所 接受 的 主要 卫生 服务 记录 都 被 记录 在 居民 健康 档案 之 中 。 借 助 
居民 健康 档案 的 建立 和 运作 ， 与 每 个 居民 个 体 相关 的 医疗 健康 数据 都 被 有 效 地 存储 ， 并 在 
合理 合法 的 范围 内 交换 和 流通 。 

3) ”可 穿戴 设备 的 应 用 

随 着 科学 技术 的 快速 进步 和 发 展 ， 获 取 医 疗 大 数据 的 途径 并 不 仅仅 局 限于 政府 所 开发 
的 医疗 数据 库 体系 ， 可 穿戴 设备 的 应 用 为 保险 公司 获取 其 被 保险 人 健康 信息 提供 了 另 一 种 
有 效 途径 。 在 大 数据 技术 的 应 用 下 ， 保 险 公司 可 以 通过 分 析 可 穿戴 设备 所 收集 的 被 保险 人 
各 项 健康 指标 数据 实时 了 解 被 保险 人 的 身体 状况 ， 并 从 众多 被 保险 人 的 健康 数据 中 分 析出 
健 体 与 弱 体 之 间 的 差异 。 

目前 可 穿戴 设备 的 应 用 设计 已 日 趋 成 熟 ， 各 类 可 穿戴 设备 相继 出 现在 市 场 当中 。 例 
如 ， 蓝 牙 耳 机 和 扬声器 厂商 Jawbone 推出 了 其 可 穿戴 设备 一 UP， 国内 的 小 米 公 司 推出 了 
其 可 穿戴 设备 一 一 小 米 手 环 ， 苹 果 公 司 在 其 iOS8 系统 中 推出 了 名 为 HealthKit 的 集成 应 用 。 

南非 最 大 的 健康 险 公司 一 一 Discovery 公司 推出 了 Vitality( 健 行 天 下 ) 健 康 促进 计划 ， 该 
计划 致力 于 通过 建立 科学 的 健康 管理 和 激励 体系 ， 鼓 励 其 被 保险 人 关注 自身 健康 ， 并 以 恰 
当 方 式 对 其 被 保险 人 的 健康 行为 和 饮食 习惯 进行 干预 。Discovery 公司 以 该 健康 促进 计划 为 
基础 建立 了 保费 的 活力 优化 系统 ， 被 保险 人 自身 的 活力 状态 会 对 他 们 的 实际 保费 产生 影 
响 ， 且 被 保险 人 的 活力 状态 越 好 ， 其 所 能 享受 到 的 增值 服务 奖励 相应 地 也 就 越 丰 富 。 在 对 
被 保险 人 的 活力 状态 进行 测算 时 ，Discovery 公司 采用 了 线 上 与 线 下 渠道 相 结合 的 方式 获取 
被 保险 人 的 相关 健康 数据 ， 其 中 线 上 渠道 是 指 通过 利用 Withings 推出 的 可 穿戴 设备 获取 被 
保险 人 的 活动 数据 和 健康 数据 ， 而 线 下 渠道 是 与 健身 机 构 进行 合作 。 


2. 大 数据 与 健康 险 的 产品 设计 


健康 险 产 品 设计 必须 兼顾 社会 伦理 和 保险 成 本 ， 通 常 包 括 确定 所 提供 的 服务 和 进行 产 
品 定价 两 个 方面 的 工作 。 

1) “健康 险 提 供 的 服务 

在 考虑 健康 险 产品 所 提供 的 服务 时 ， 会 对 以 下 内 容 进行 确定 。 

(1) 单个 被 保险 人 在 本 期 间 内 发 生 的 医疗 费用 支出 ， 本 产品 能 够 负担 多 大 的 比例 。 

(2) 在 不 同 的 健康 状态 下 ， 被 保险 人 未 来 肉 患 某 种 疾病 的 概率 ， 以 及 各 类 疾病 的 平均 
诊治 费用 。 

(3) 单 病 种 的 报销 额度 ， 即 被 保险 人 急 患 某 种 疾病 时 本 产品 能 为 其 报销 多 少 手术 费 
用 、 医 药 费用 以 及 住院 费用 。 

在 对 第 (2) 项 内 容 进行 确定 时 ， 保 险 公司 可 以 利用 大 数据 技术 从 海量 电子 病历 数据 中 ， 
计算 出 各 类 疾病 的 平均 诊治 费用 ， 并 且 通 过 跟踪 多 位 患者 的 病情 发 展 状况 ， 计 算出 疾病 转 
化 的 概率 。 

2) ”健康 险 产 品 定价 

保险 产品 定价 的 主要 依据 是 理赔 标的 发 生 概率 。 在 大 数据 应 用 以 前 ， 测 算 理赔 标的 发 
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生 概 率 所 利用 的 大 部 分 数据 都 是 来 源 于 行业 内 的 历史 数据 和 统计 数据 。 随 着 科学 技术 的 不 
断 进步 ， 现 今 无 论 是 疾病 的 诊断 方法 还 是 治疗 模式 都 发 生 了 巨大 变化 ， 历 史 数据 已 不 再 具 
有 代表 性 ， 而 且 传统 的 数据 统计 方式 已 经 过 时 。 例 如 ， 在 重大 疾病 险 中 ， 心 肌 梗 死 的 冠状 
动脉 造影 早已 是 诊断 该 疾病 的 最 佳 标准 ， 但 在 相应 健康 险 产 品 定价 中 仍 沿用 老 的 诊断 标 
准 ， 造 成 其 定价 失 准 。 

而 在 大 数据 技术 的 应 用 下 ， 健 康 险 产 品 的 定价 将 更 为 精准 。 大 数据 思维 认为 ， 小 样本 
数据 会 使 误差 加 大 ， 依 靠 误差 较 大 的 数据 无 法 设计 出 接近 真实 概率 的 产品 。 因 而 要 通过 利 
用 大 数据 技术 对 海量 数据 进行 分 析 挖 掘 ， 保 证 其 产品 定价 与 客户 投保 的 需求 偏好 相 一 致 ， 
避免 由 于 定价 过 高 而 无 法 被 潜在 投保 人 认可 和 接受 ， 或 由 于 定价 过 低 使 保费 难以 覆盖 风 
险 ， 进 而 使 保险 公司 自身 产生 亏损 。 


【案例 5.1】 UBI 车 险 产 品 和 UBI 车 险 服务 


1. UBI 车 险 产品 

英国 Aviva 保险 公司 针对 年 轻 司 机 需要 负担 高 于 其 风险 水 平 的 保费 这 一 现象 ， 借 助 大 
数据 分 析 ， 开 发 了 基于 驾驶 人 驾驶 行为 的 驾驶 风险 预测 模型 ， 从 而 实现 了 个 性 化 定价 。 这 
一 举措 不 仅 改 善 了 投保 驾驶 人 驾驶 习惯 ， 同 时 也 为 公司 削减 了 一 定 的 运营 成 本 。Aviva 保 
险 公司 不 仅 对 客户 个 人 信息 、 车 辆 信息 和 使 用 情况 、 驾 驶 历史 等 数据 进行 收集 ， 还 引入 车 
载 设备 ， 以 通过 手机 APP 来 监控 驾驶 人 在 起 步 后 行驶 200 英里 的 驾驶 状态 。Aviva 保险 公 
司 根据 驾驶 人 驾驶 行为 (如 加 速 、 谭 车 和 扬 弯 时 的 频率 和 程度 ) 的 数据 记录 ， 从 中 分 析出 该 
驾驶 人 的 驾驶 风险 并 对 其 进行 定价 一 一 确定 个 性 化 的 保费 ， 并 向 该 驾驶 人 提供 相应 的 保险 
服务 。 同 时 Aviva 保险 公司 还 为 安全 驾驶 者 提供 最 高 达 20% 的 保费 折扣 。 实 施 后 的 相关 数 
据 显 示 其 被 保驾 驶 人 的 驾驶 安全 状况 有 所 改善 ，Aviva 保险 公司 这 一 新 商业 模式 也 为 其 赢 
得 了 更 高 的 客户 满意 度 和 有 所 降低 的 客户 流失 率 。 

Metromile 保险 公司 借助 汽车 监控 设备 的 使 用 对 其 车 险 定价 模式 进行 了 调整 ， 从 而 实 
现 了 按 驾 驶 里 程 收 费 。 它 的 里 程 定价 模式 是 基于 车 载 汽车 监控 设备 的 技术 ， 通 过 客户 安装 
的 设备 追踪 投保 车 辆 的 行驶 里 程 进而 为 其 确定 应 缴纳 的 保费 。Metromile 保险 公司 的 投保 
人 只 需 每 月 支付 15~40 美元 的 固定 费用 以 及 2 一 6 美 分 /英里 的 使 用 费 即 可 。 这 一 款 车 险 产 
品 并 不 考量 驾驶 人 如 何 开车 ， 而 仅 关心 投保 车 辆 所 行驶 距离 。Metromile 保险 公司 的 这 款 
保险 产品 在 行驶 里 程 不 多 且 尚 未 被 充分 服务 的 车 险 细 分 市 场 中 有 很 大 空间 。 平 均 计算 来 
看 ， 这 款 保险 产品 可 为 年 行驶 里 程 在 10000 英里 的 驾驶 者 节省 40% 的 保费 。 

2. UBI 车 险 服 务 

美国 Liberty Mutual 保险 公司 为 企业 客户 的 大 型 车 队 提供 GPS 跟踪 监控 设备 。 企 业 客 
户 将 该 设备 安装 在 其 所 有 的 汽车 上 ， 可 通过 该 GPS 跟踪 监控 设备 回 传 的 里 程 数 、 行 车 时 
速 、 加 速 和 和 章 车 情况 以 及 车 辆 所 处 位 置 等 与 投保 车 辆 相关 的 数据 信息 ， 进 而 帮助 投保 人 对 
其 车 队 进行 监控 并 帮助 车 队 司机 改善 其 驾驶 习惯 ， 并 在 此 基础 上 进一步 开展 车 辆 安全 管 
理 ， 从 而 有 效 地 对 相关 风险 进行 控制 。 

英国 Insurethebox 保险 公司 将 含有 GPS、 运 动 传感器 、SIM 卡 和 电脑 软件 的 车 载 盒 子 
装 在 汽车 上 ， 通 过 GPS 技术 追踪 定位 失窃 车 辆 ， 协 助 客户 找 回 。 当 该 车 载 盒子 检测 到 车 辆 
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发 生 撞 击 或 意外 事故 时 ，Insurethebox 保险 公司 会 及 时 与 客户 通话 ， 对 客户 人 身 安 全 进行 
核实 ; 在 特殊 的 紧急 情况 下 ，Insurethebox 保险 公司 还 会 呼叫 应 急救 援 部 门 参与 事故 救 
援 。 而 车 载 盒子 里 所 存储 的 数据 也 可 用 于 协助 公司 对 投保 车 辆 的 毁损 情况 进行 分 析 。 
(资料 来 源 : 大 数据 及 车 联网 在 车 险 中 的 应 用 和 案例 ) 
【案例 5.2】 大 数据 下 的 健康 险 


众 安 在 线 人 寿 保险 公司 推出 了 其 大 数据 智能 健康 险 产 品 一 一 步 步 保 ， 这 是 众 安 在 线 人 
寿 保险 公司 和 小 米 运动 、 乐 动力 APP 合作 推出 的 保险 产品 。 客户 ( 即 被 保险 人 ) 投 保 时 ， 系 
统 会 根据 其 历史 运动 情况 以 及 预期 运动 目标 ， 向 其 推荐 不 同 保 额 档 位 的 重大 疾病 保险 保障 
(目前 分 20 万 元 、15 万 元 、10 万 元 三 档 )， 用 户 历 史 平 均 步 数 越 多 ， 推 荐 保 额 就 越 高 ， 最 
高 可 换取 20 万 元 重 疾 保障 ; 其 中 ， 如 果 被 保险 人 在 参加 健康 计划 前 30 天 的 平均 步 数 达到 
5000 步 ， 则 被 推荐 10 万 元 保 额 重大 疾病 保险 保障 。 在 申请 加 入 健康 计划 后 ， 申 请 日 的 次 
日 会 作为 每 月 的 固定 结算 日 ， 只 要 每 天 运动 步 数 达 到 10 000 步 ， 下 月 结算 时 其 保费 就 可 以 
多 免费 1 天 。 即 保单 生效 后 ， 用 户 每 天 运动 的 步 数 越 多 ， 下 个 月 需要 缴纳 的 保费 就 越 少 。 
对 于 这 款 以 运动 数据 作为 其 实际 承保 定价 依据 的 保险 产品 ， 众 安 在 线 人 寿 保险 公司 称 其 为 
“国内 首 款 与 可 穿戴 设备 及 运动 大 数据 结合 的 健康 管理 计划 ”， 并 表示 未 来 将 会 接 入 更 多 
可 穿戴 设备 和 运动 APP， 进 而 通过 和 覆盖 更 多 的 运动 人 群 以 实现 其 产品 定价 和 规模 优势 的 双 
提升 。 


(@) 5.3 精准 营销 


大 数据 能 够 帮助 保险 公司 收集 海量 且 多 样 的 客户 数据 ， 使 保险 公司 能 够 基于 大 数据 的 
分 析 结 果 找 出 不 同 客户 的 潜在 保险 需求 ， 进 而 将 不 同 的 保险 产品 恰当 地 推荐 给 有 该 产品 潜 
在 需求 的 特定 客户 。 因 而 在 大 数据 技术 应 用 的 背景 下 ， 保 险 公 司 的 营销 不 再 是 以 同一 个 广 
告 内 容 和 营销 手段 对 所 有 的 潜在 客户 群体 进行 营销 ， 而 是 针对 具有 不 同 保险 需求 特征 的 细 
分 客户 群体 进行 有 针对 性 的 营销 。 随 着 移动 互联 网 技术 的 快速 发 展 和 智能 移动 设备 的 日 益 
普及 ， 各 类 手机 应 用 客户 端 所 收集 的 客户 各 类 操作 行为 、 人 们 在 其 社交 媒体 上 分 享 的 文 
字 、 图 片 、 视 频 等 都 可 以 成 为 了 解 和 刻画 客户 的 重要 数据 ， 借 助 大 数据 技术 对 这 些 数据 进 
行 采集 和 分 析 ， 保 险 公 司 可 以 准确 地 了 解 客户 的 特点 和 需要 ， 为 数据 价值 的 商业 运用 提供 
基础 。 


5.3.1 保险 精准 营销 


1. 保险 精准 营销 的 概念 和 步骤 


大 数据 背景 下 的 保险 精准 营销 ， 是 指 保险 公司 在 可 量化 的 数据 基础 上 对 单一 客户 的 消 
费 模 式 和 特点 进行 分 析 和 归纳 ， 对 其 客户 群体 进行 划分 ， 进 而 精准 地 找到 其 目标 客户 并 精 
准 地 向 目标 客户 开展 营销 活动 ， 以 提高 其 营销 效率 的 过 程 。 


(资料 来 源 : 凤 风 财经 ) 
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保险 公司 进行 精准 营销 的 步骤 如 下 。 

1) “客户 信息 采集 

了 解 客户 的 基本 信息 和 行为 偏好 是 精准 营销 实现 的 基础 。 因 而 保险 公司 不 仅 要 对 其 内 
部 掌握 的 客户 基本 信息 (如 客户 的 年 龄 、 性 别 、 家 庭 成 员 状 况 、 学 历 、 职 业 、 收 入 、 资 产 持 
有 状况 等 ) 加 以 利用 ， 还 要 加 强 与 网 络 购物 平台 、 网 络 社交 平台 以 及 其 他 掌握 客户 数据 的 第 
三 方 进行 合作 ， 从 而 获取 更 多 的 客户 行为 信息 。 

2) 用户 数 据 分 析 

在 前 一 步骤 对 海量 客户 数据 进行 收集 的 基础 上 ， 保 险 公 司 要 利用 大 数据 理论 和 分 析 模 
型 对 所 收集 的 客户 数据 进行 相应 的 分 析 和 挖掘 ， 从 而 实现 对 客户 特征 和 客户 行为 的 精准 刻 
画 和 描述 。 

3) ”结果 分 析 解 读 

基于 上 一 步骤 的 分 析 结果 ， 保 险 公 司 可 以 对 其 所 面临 的 众多 客户 进行 有 效 的 细 分 ， 并 
对 每 一 细 分 客户 群体 的 保险 需求 进行 分 析 和 判断 ， 进 而 为 其 匹配 恰当 的 保险 产品 。 

4) “实施 营销 

在 前 述 步 又 有 效 实 施 的 基础 之 上 ， 保 险 公 司 要 根据 其 每 一 细 分 客户 群体 的 偏好 特征 以 
及 相应 保险 产品 的 主要 特点 ， 制 定 出 最 佳 的 营销 方案 ， 进 而 在 最 佳 的 时 间 向 特定 细 分 客户 
群体 进行 营销 。 

2. 传统 保险 营销 的 不 足 


1) 市场 细 分 不 够 充分 

虽然 我 国 的 保险 公司 对 市 场 进行 了 一 定 的 细 分 但 不 够 充分 ， 许 多 保险 公司 在 进行 市 场 
细 分 时 都 忽视 了 保险 市 场 需求 在 地 域 之 间 的 差异 、 群 体 层次 之 间 的 差异 、 城 乡 之 间 的 差异 
以 及 收入 水 平 的 差异 。 这 也 导致 传统 保险 营销 实质 上 是 广 撤 网 式 营销 ， 营 销 效率 较 低 。 

2) “对 客户 需求 不 够 重视 

由 于 传统 保险 营销 模式 缺乏 针对 性 ， 且 保险 公司 所 推出 的 保险 产品 又 具有 同 质 化 的 特 
征 ， 导 致 同 一 客户 就 同一 风险 标的 在 同一 家 保险 公司 中 重复 投保 的 现象 出 现 ， 这 无 疑 会 使 
客户 丧失 对 保险 公司 的 信心 。 而 且 客户 多 样 化 的 潜在 保险 需求 也 无 法 得 到 有 效 的 满足 。 

3) ”适应 市 场 的 速度 较 慢 

在 传统 的 保险 营销 过 程 中 ， 保 险 公司 对 潜在 市 场 需求 的 变化 不 够 敏感 ， 即 便 是 发 现 了 
潜在 市 场 需求 ， 碍 于 其 烦琐 复杂 、 效 率 低 下 的 产品 设计 过 程 ， 其 最 终 所 推出 的 保险 产品 
无 法 与 客户 新 的 潜在 保险 需求 相 匹配 。 

4)” 重 短期 利润 、 轻 长 期 服务 

在 传统 的 保险 营销 模式 下 ,保险 代理 人 为 了 追求 更 高 的 佣金 收入 会 向 客户 推销 价格 上 
更 具 吸 引力 而 与 客户 实际 保险 需求 不 相 匹配 的 保险 产品 ， 使 有 保险 意愿 的 优质 客户 的 保险 
需求 无 法 得 到 应 有 的 满足 ， 进 而 使 客户 对 保险 公司 的 忠诚 度 和 依赖 度 减 少 ， 造 成 客户 流失 。 


3. 大 数据 与 保险 营销 环节 的 契合 


我 们 可 以 将 保险 营销 的 过 程 分 为 客户 接触 、 客 户 联系 、 客 户 赢 取 3 个 环节 。 在 传统 的 
保险 营销 模式 中 ， 保 险 公 司 的 营销 渠道 主要 包括 保险 公司 自 有 的 销售 团队 以 及 各 种 形式 的 
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保险 中 介 。 其 中 ， 保 险 中 介 作为 保险 公司 与 客户 之 间 的 媒介 ， 能 够 利用 自身 的 规模 优势 降 
低 协调 成 本 ， 进 而 为 保险 公司 带 来 经 济 价值 。 在 大 数据 技术 应 用 的 背景 下 ， 保 险 营销 将 通 
过 构建 数据 产生 、 数 据 采 集 和 传输 、 数 据 处 理应 用 3 个 环节 来 蔡 代 传统 的 保险 营销 过 程 。 
其 中 ， 数 据 产生 环节 与 传统 营销 过 程 中 的 客户 接触 环节 相对 应 ， 数 据 采集 和 传输 环节 与 传 
统 营销 过 程 中 的 客户 联系 环节 相对 应 ， 数 据 处 理应 用 环节 则 与 传统 营销 过 程 中 的 客户 赢 取 
环节 相对 应 ( 见 图 5.9)。 

1) 数据 产生 环节 与 客户 接触 环节 的 契合 

在 传统 的 保险 营销 中 ， 客 户 接触 环节 主要 是 通过 保险 业务 人 员 来 完成 的 。 而 在 大 数据 
| 代 ， 保 险 公司 可 以 通过 数据 接触 客户 ， 进 而 实现 对 客户 及 其 行为 习惯 实时 的 分 析 和 预 
|。 即 在 接触 客户 之 时 就 有 相关 客户 数据 产生 。 而 各 类 智能 设备 的 推出 和 普及 ， 使 保险 公 
能 够 实时 地 与 客户 进行 交流 和 沟通 ， 并 实时 地 掌握 客户 的 各 项 特征 。 


传统 营销 模式 数字 营销 模式 


王 一 > 
数据 
数据 处 理应 用 数据 采集 和 传输 


下 于 


ol 


保险 中 介 及 
公司 自 有 团队 


5.9 大 数据 与 保险 营销 环节 的 契合 


2) “数据 采集 和 传输 环节 与 客户 联系 环节 的 契合 

保险 公司 在 与 客户 进行 接触 后 需要 跟 客 户 进 行 有 效 的 沟通 互动 ， 即 与 客户 之 间 产 生 联 
系 。 随 着 近年 来 通信 技术 的 快速 发 展 ， 保 险 公 司 对 客户 数据 的 采集 和 传输 效率 得 到 大 幅 提 
高 。 保 险 公司 与 客户 的 沟通 也 更 加 的 简单 和 快捷 ， 二 者 之 间 互 相传 达 的 信息 也 更 加 的 直观 
和 全 面 。 

在 这 一 过 程 中 ， 不 仅 客户 能 够 享受 到 优质 高 效 的 保险 服务 ， 进 而 与 保险 公司 保持 更 加 
紧密 的 联系 ; 而且 保险 公司 也 可 以 通过 高 效 的 客户 联系 在 短 时 间 内 聚集 大 量 的 客户 。 

3) “数据 处 理应 用 环节 与 客户 赢 取 环节 的 契合 

客户 的 相关 需求 被 传递 到 保险 公司 后 ， 保 险 公 司 需要 通过 快速 且 优 质 的 回应 来 赢得 客 
户 。 而 在 回应 客户 的 过 程 中 离 不 开 数 据 的 处 理 和 应 用 ， 因 为 只 有 高 效 地 对 全 方位 的 海量 数 
据 进 行 处 理 和 应 用 ， 才 能 有 效 地 回应 客户 。 大 数据 技术 和 云 计算 技术 的 结合 使 大 量 客户 数 
据 在 到 达 保险 公司 后 可 以 被 有 效 地 利用 ， 进 而 使 针对 具体 客户 的 评估 、 预 测 以 及 动态 定价 
得 以 实现 ， 为 保险 公司 对 客户 保险 需求 的 高 效 回应 提供 了 保证 。 数 据 的 处 理应 用 环节 使 保 
险 公司 形成 了 有 效 的 客户 互动 循环 ， 进 而 帮助 其 赢 取 更 多 的 客户 。 


5.3.2 大 数据 与 保险 精准 营销 
精准 营销 的 实现 基础 是 精确 定位 。 精 一 一 即 科学 的 细 分 ， 市 场 、 客 户 和 服务 的 细 分 都 
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要 精 ; 准 一 一 即 准确 的 把 握 ， 包 括 信息 的 采集 和 分 析 、 公 司 品牌 的 定位 以 及 产品 服务 的 投 
放 都 要 准 。 保 险 公 司 通过 利用 大 数据 技术 能 够 实现 对 市 场 的 有 效 细 分 ， 对 其 保险 产品 的 目 
标 客户 进行 识别 ， 在 对 目标 客户 的 分 布 特征 、 信 息 来 源 和 购买 倾向 进行 分 析 的 基础 上 进行 
针对 性 营销 。 例 如 ， 保 险 公 司 可 以 通过 运用 新 型 营销 方式 为 日 均 手机 上 网 时 间 超 过 6 小 时 
的 客户 推荐 健康 保障 险 、 手 机 意外 险 ， 为 有 吸烟 嗜好 、 经 常 应 酬 、 爱 吃 肉 食 的 客户 推荐 防 
癌 险 、 重 大 疾病 保险 ， 为 使 用 高 端 智 能 手机 的 客户 推荐 碎 屏 险 ， 为 在 旅行 服务 平台 上 消费 
的 客户 推荐 旅游 相关 保险 产品 等 。 


1. 大 数据 下 的 新 保险 营销 方式 


保险 公司 在 大 数据 背景 下 对 客户 保险 需求 进行 分 析 时 ， 相 关 的 数据 来 源 不 再 仅 限于 保 
险 行业 内 部 的 保险 客户 数据 ， 还 包括 保险 体系 以 外 的 数据 ， 包 括 与 保险 公司 进行 合作 的 第 
三 方 自身 所 积累 的 客户 数据 、 网 络 社交 平台 所 积累 的 客户 数据 等 。 这 些 外 部 数据 对 保险 公 
司 的 市 场 细 分 具有 极 大 的 利用 价值 。 在 对 客户 信息 和 客户 行为 的 相关 数据 进行 深度 分 析 的 
基础 上 ， 保 险 公 司 能 有 效 地 预测 客户 需求 、 挖 掘 潜在 客户 并 向 其 推荐 适当 的 保险 产品 ， 从 
而 实现 个 性 化 的 精准 营销 。 大 数据 下 的 新 保险 营销 方式 有 以 下 几 种 。 

1) “搜索 引擎 营销 

搜索 引擎 营销 (SEM)， 是 指 在 搜索 引擎 平台 上 所 进行 的 网 络 营销 。 保 险 公 司 通过 与 搜 
索引 擎 平台 合作 ， 利 用 大 数据 技术 了 解 该 搜索 引擎 用 户 个 体 之 间 不 同 的 搜索 行为 特征 以 及 
其 主要 关注 焦点 ， 进 而 在 用 户 检索 信息 的 间隙 有 针对 性 地 将 本 公司 适宜 该 用 户 的 保险 产品 
及 服务 信息 传递 给 该 目标 用 户 ， 进 而 保险 公司 可 以 及 时 获取 到 在 相关 检索 结果 页 面 查看 其 
所 展示 保险 产品 和 服务 的 用 户 信息 ， 并 及 时 地 向 这 些 潜在 客户 实施 营销 策略 。 与 传统 保险 
营销 方式 相 比 ， 搜 索引 擎 营销 目前 已 成 为 保险 公司 获取 客户 、 进 行 精准 营销 最 为 直接 有 效 
的 方式 之 一 ， 其 优势 主要 表现 为 以 下 几 个 方面 。 

(1) 突破 时 空 限制 ， 营 销 对 象 广泛 。 

(2) 广告 投放 精准 ， 且 具有 针对 性 。 

(3) 信息 传播 速度 快 ， 营 销 效率 较 高 。 

(4) 可 以 对 营销 推广 的 效果 进行 监控 。 

2) ” 微 信保 险 营 销 

随 着 移动 互联 网 技术 的 快速 发 展 、 有 着 强大 用 户 基 础 的 微 信 平台 也 在 不 断 开发 出 更 多 
的 服务 功能 。 正 基于 此 ， 许 多 保险 公司 都 开始 在 微 信 平 台 上 提供 保险 服务 。 通 过 利用 大 数 
据 技术 ， 保 险 公 司 可 以 有 效 地 获取 和 了 解 其 在 微 信 平 台中 的 潜在 客户 ， 从 而 向 潜在 客户 进 
行 精准 营销 。 潜 在 客户 可 以 通过 保险 公司 在 微 信 平 台 上 的 服务 窗口 及 时 接收 到 与 其 保险 需 
求 相符 的 保险 产品 营销 信息 ， 对 其 感 兴趣 的 保险 产品 可 以 直接 进行 投保 并 完成 相应 的 支 
付 ， 存量 客户 可 以 通过 保险 公司 在 微 信 平台 上 的 服务 窗口 接受 到 便捷 的 保险 服务 ， 如 保 
单 信息 查询 、 保 单 变更 、 网 点 查找 、 客 户 投 诉 、 理 赔 咨 询 、 理 赔 进 度 查 询 、 快 速 赔 款 、 
报案 注销 等 。 保 险 公 司 通过 微 信 平台 进行 精准 营销 可 以 使 客户 的 黏 性 和 活跃 度 得 到 有 效 
的 提高 。 

3) ” 微 博 保险 营销 

微 博 作 为 当前 另 一 大 主流 网 络 社交 平台 ， 在 营销 方面 也 具有 极 高 的 利用 价值 ， 因 而 许 
多 保险 公司 都 开通 了 其 微 博 服务 账号 。 微 博 在 信息 传递 方面 具有 很 大 优势 。 保 险 公司 通过 
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其 微 博 服务 账号 能 够 及 时 、 直 观 地 向 公众 发 布 其 保险 产品 和 服务 的 营销 信息 ， 开 展 多 种 多 
样 的 网 络 营销 活动 ， 并 能 实时 地 与 其 客户 进行 良好 的 互动 。 此 外 ， 具 有 社会 化 媒体 特点 的 
微 博 会 实时 发 布 相关 热点 事件 ， 保 险 公 司 可 以 借助 热点 事件 巧妙 且 及 时 地 进行 保险 营销 ， 
从 而 吸引 更 多 的 用 户 关注 ， 与 更 多 的 用 户 达到 共鸣 ， 使 其 与 潜在 客户 之 间 的 距离 不 断 被 拉 
近 ， 从 而 达到 高 效 的 营销 效果 。 

4) “了 P2P 保险 营销 

P2P(Peer-to-Peer) 保 险 营销 模式 ， 是 指 在 人 与 人 之 间 的 社交 关系 基础 之 上 所 产生 的 互助 
保险 模式 。 这 不 仅 是 一 种 新 的 保险 营销 模式 ， 更 是 一 种 新 型 的 保险 存在 方式 。 就 发 展 历 史 
来 看 ， 保 险 最 初 就 是 从 小 团体 成 员 之 间 所 进行 的 风险 管理 互助 开始 的 ， 后 来 逐渐 从 基于 单 
纯 的 人 际 关系 演化 为 基于 合同 关系 的 风险 管理 互助 ， 保 险 公司 也 由 此 产生 。 在 大 数据 的 时 
代 背 景 下 ， 最 初 的 互助 保险 形式 又 将 会 回归 到 风险 管理 领域 ， 但 与 最 初 的 互助 保险 所 不 同 
的 是 ， 互 联网 以 及 大 数据 的 经 营 理念 和 相关 技术 被 融入 其 中 ， 即 产生 基于 互联 网 的 “ 众 
保 ” 保 险 模 式 。 国 内 外 在 P2P 保险 领域 已 经 有 所 实践 ， 如 德国 的 Friendsurance 公司 ， 我 国 
的 “ 抗 癌 公 社 ” 和 泛 华 保险 服务 集团 推出 的 “e 互助 ”等 。 


2. 大 数据 下 精准 营销 的 实现 路 径 


1) ”营销 理念 的 变革 

在 传统 的 保险 营销 理念 之 下 ， 保 险 公司 已 习惯 于 借助 有 限 且 粗 劣 的 营销 数据 去 进行 相 
应 产品 和 服务 的 营销 ， 对 营销 成 本 的 控制 和 营销 效果 的 评价 标准 都 相对 较 弱 。 在 大 数据 应 
用 的 背景 下 ， 传 统 保险 营销 的 低 效率 将 不 复 存 在 ， 保 险 公 司 应 与 时 俱 进 地 积极 获取 与 营销 
相关 的 数据 信息 ， 了 解 和 洞察 其 潜在 客户 ， 进 而 以 精细 上 且 准 确 的 营销 方式 对 客户 进行 营 
销 ， 从 而 使 其 客户 转化 率 有 效 提高 。 

2) ”对 差异 化 需求 进行 分 析 

(1) 建立 数据 库 。 

客户 数据 的 采集 和 分 析 是 精准 营销 的 基础 ， 因 而 保险 公司 应 当 对 多 种 信息 获取 渠道 进 
行 灵活 运用 ， 将 其 所 掌握 的 行业 内 部 数据 和 分 散 于 其 他 领域 的 外 部 数据 进行 汇集 ， 在 利用 
大 数据 技术 对 这 些 数据 进行 分 类 和 转化 后 ， 将 这 些 数据 存储 于 其 数据 库 之 中 。 拥 有 独立 且 
成 熟 的 数据 库 是 保险 公司 进行 精准 营销 的 前 提 。 

(2) 分 析 差 异化 需求 。 

大 数据 背景 下 的 保险 精准 营销 更 加 关注 客户 差异 化 的 潜在 保险 需求 。 保 险 公司 借助 大 
数据 技术 对 其 所 掌握 的 与 客户 相关 的 海量 数据 进行 分 析 和 挖掘 ， 能 够 对 每 一 客户 个 体 的 潜 
在 保险 需求 进行 预测 ， 从 而 在 合适 的 时 间 将 合适 的 保险 产品 和 服务 推荐 给 合适 的 客户 。 对 
客户 差异 化 的 保险 需求 进行 预测 是 保险 公司 精准 营销 的 关键 。 

3) ”营销 模式 的 全 面 精准 化 

(1) 开发 精准 化 的 产品 。 

保险 公司 基于 其 所 获取 的 海量 数据 ， 以 客户 的 保险 需求 为 出 发 点 设计 相应 的 保险 产品 
和 服务 ， 即 为 其 所 提供 的 保险 产品 和 服务 增添 差异 化 的 市 场 价值 ， 以 迎合 相应 客户 的 保险 
需求 。 在 对 客户 保险 需求 进行 洞察 的 基础 上 推出 精准 化 的 保险 产品 和 服务 是 经 济 且 高 
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效 的 。 

(2) 制定 精准 化 的 价格 。 

承保 定价 决定 着 保险 公司 的 价 利水 平 ， 因 而 保险 公司 应 当 利 用 大 数据 技术 对 其 所 提供 
的 精准 化 保险 产品 和 服务 进行 精准 化 的 定价 ， 向 不 同 的 投保 客户 收取 与 其 风险 水 平 相 匹配 
的 保费 ， 进 而 在 保险 市 场 中 的 供给 与 需求 之 间 找 到 利润 的 平衡 点 。 

(3) 进行 精准 化 的 营销 沟通 。 

保险 公司 通过 分 析 和 挖掘 其 所 掌握 的 海量 客户 数据 可 以 了 解 客 户 的 兴趣 爱好 和 行为 习 
惯 ， 进 而 以 投 其 所 好 的 营销 内 容 和 营销 方式 在 恰当 的 时 间 与 潜在 目标 客户 进行 营销 互动 ， 
即 对 潜在 目标 客户 进行 精准 化 的 营销 沟通 。 

(4) 建立 增值 的 服务 体系 。 

保险 公司 可 以 依托 其 所 掌握 的 海量 客户 数据 向 客户 提供 更 多 与 其 保险 产品 和 服务 相关 
的 增值 服务 ， 进 而 在 对 客户 的 特定 风险 进行 管理 的 同时 ， 以 人 性 化 的 服务 提高 其 客户 的 符 
性 ， 赢 得 更 多 市 场 竞争 优势 。 

4) ”精准 营销 的 效果 反馈 

保险 公司 还 应 当 借 助 大 数据 技术 对 其 精准 营销 活动 的 效果 进行 评估 和 反馈 ， 以 帮助 其 
改进 现 有 精准 营销 活动 中 的 不 足 ， 从 而 使 其 下 一 阶段 的 保险 营销 活动 更 为 精准 。 


5.3.3 ”组 建 垂 直 平 台 生态 图 


伴随 着 移动 互联 网 和 大 数据 等 新 技术 的 快速 发 展 ， 保 险 公司 作为 保险 价值 链 中 的 关键 
一 环 正在 积极 地 引入 数字 化 技术 以 优化 客户 在 其 所 提供 保险 服务 中 体验 ， 提 升 其 自身 的 精 
准 营 销 能 力 、 风 险 管理 能 力 和 客户 影响 力 。 其 中 一 些 具 有 一 定 实力 的 保险 公司 已 开始 尝试 
通过 建立 数字 平台 来 整合 保险 价值 链 上 的 所 有 相关 服务 ， 从 而 构建 起 平台 生态 圈 。 


1. 平台 生态 圈 的 概念 


平台 生态 圈 是 指 商业 活动 的 各 利益 相关 者 通过 共同 建立 一 个 数字 化 价值 平台 ， 将 价值 
链 上 各 利益 相关 者 所 掌握 的 数据 、 所 提供 的 产品 和 服务 联系 起 来 ， 以 客户 一 系列 的 核心 需 
求 为 出 发 点 向 客户 提供 组 合 服务 ， 进 而 达到 优 于 利益 各 方 单独 提供 产品 和 服务 的 经 济 效 
果 。 其 中 ， 数 字 化 的 价值 平台 可 以 是 操作 系统 、 应 用 程序 商店 、 社 交 网 站 或 其 他 形式 。 

平台 生态 圈 与 传统 业务 模式 的 不 同体 现在 以 下 3 个 方面 。 

1) ”以 客户 需求 为 中 心 

平台 生态 圈 以 客户 需求 为 中 心 而 非 以 产品 和 服务 为 中 心 ， 相 关 利 益 各 方 将 根据 客户 需 
求 的 不 同 提供 具有 差异 化 的 产品 和 服务 ， 使 客户 的 相关 需求 均 能 在 该 生态 圈 中 被 满足 。 

2) ”以 数据 平台 为 支柱 

与 客户 相关 的 信息 数据 被 存储 在 数字 化 价值 平台 之 中 ， 并 且 为 平台 生态 圈 的 各 方 利益 
相关 者 所 共享 ， 以 帮助 他 们 准确 地 捕获 客户 需求 并 对 其 所 提供 的 产品 和 服务 进行 优化 ， 进 
而 提升 客户 体验 。 
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3) ”由 多 方 利益 相关 者 组 成 

平台 生态 圈 由 多 个 身 处 不 同行 业 的 企业 组 成 ， 客 户 的 相关 需求 将 通过 各 方 参与 者 之 间 
的 业务 竞 合 得 以 满足 。 

对 平台 生态 圈 的 构建 方 来 说 ， 构 建 平台 生态 圈 的 根本 目的 在 于 吸引 更 多 的 潜在 客户 、 
挖掘 存量 客户 的 新 需求 ， 在 扩大 企业 业务 规模 或 业务 范围 的 同时 ， 实 现 企业 品牌 与 剧 利 能 
力 的 双 提 升 。 

2. 构建 垂直 平台 生态 圈 的 动因 


保险 公司 构建 垂直 平台 生态 圈 的 动因 有 以 下 几 个 方面 。 

1) “获取 更 多 客户 数据 

通过 构建 平台 生态 圈 ， 保 险 公司 可 以 从 其 他 参与 者 处 获取 到 更 多 行业 外 部 的 客户 数 
据 ; 并 能 在 与 客户 高 频率 的 沟通 互动 中 ， 提 升 客户 的 忠诚 度 。 

2) ”实现 精准 营销 

保险 公司 通过 对 其 在 平台 生态 圈 中 所 获取 的 客户 数据 进行 有 效 的 数据 挖掘 ， 能 够 实现 
对 客户 的 细致 筛选 ， 并 能 根据 筛选 结果 有 针对 性 地 将 客户 迁移 到 其 他 的 产品 和 服务 中 去 ， 
进而 实现 精准 的 客户 迁移 和 市 场 营销 ， 使 其 客户 贡献 度 得 以 提升 。 

3) ”提供 更 多 增值 服务 

保险 公司 通过 利用 其 在 平台 生态 圈 中 所 获取 的 海量 客户 数据 ， 不 仅 能 够 对 其 现 有 产品 
和 服务 进行 优化 ， 还 能 为 其 客户 提供 更 多 具有 针对 性 的 增值 服务 。 


3. 平台 生态 圈 的 构建 


平台 生态 圈 的 构建 是 复杂 的 ， 因 此 保险 公司 在 打造 其 保险 生态 系统 时 需要 完成 的 工作 
包括 但 不 限于 以 下 几 个 方面 。 

1) 充分 了 解 自身 的 地 位 、 优 势 和 劣势 

保险 公司 需要 对 其 在 价值 链 与 市 场 中 的 地 位 、 优 势 和 劣势 有 充分 的 认识 ， 进 而 明确 其 
与 其 他 利益 相关 者 之 间 的 合作 模式 。 即 保险 公司 通过 回答 本 公司 能 够 提供 怎样 的 保险 产品 
和 服务 、 本 公司 拥有 哪些 数据 、 哪 些 公司 需要 本 公司 的 数据 、 本 公司 需要 哪些 外 部 数据 来 
支持 产品 和 服务 的 优化 等 一 系列 问题 ， 能 够 对 其 在 生态 圈 中 的 合作 内 容 和 合作 方式 进行 
确定 。 

2) ”有 效 选择 合作 方 

在 明确 合作 内 容 和 合作 方式 的 基础 上 ， 保 险 公司 要 与 价值 链 上 其 他 行业 的 具体 合作 方 
进行 选择 。 其 中 ， 合 作 方 既 可 以 是 其 他 公司 ， 也 可 以 是 同一 集团 内 的 其 他 子 公司 。 保 险 公 
司 通过 与 潜在 合作 对 象 进行 接触 和 沟通 ， 从 而 确定 出 其 最 终 具 体 的 合作 方 。 

3) ”对 平台 生态 圈 进 行 快速 试 错 

在 与 相关 合作 方 构建 起 平台 生态 圈 后 ， 保 险 公司 应 从 中 选择 某 一 个 或 几 个 产品 和 服务 
作为 测试 对 象 ， 对 所 构建 的 平台 生态 圈 进 行 快速 试 错 ， 在 与 合作 方 相互 磨合 的 过 程 中 完成 
对 测试 对 象 的 合理 评估 ， 进 而 对 其 平台 生态 圈 进 行进 一 步 的 优化 。 
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【案例 5.3】 保险 公司 与 平台 生态 圈 


德国 安 联 保险 公司 为 实现 规模 效益 和 技能 互补 ， 与 德意志 电信 展开 合作 。 安 联 保险 公 
司 基于 对 双方 技术 优势 的 利用 ， 通 过 构建 生态 系统 为 其 零售 客户 与 企业 客户 提供 独特 的 产 
品 和 服务 。 

针对 其 零售 客户 ， 安 联 保险 公司 与 德意志 电信 协作 开发 了 数字 化 的 “联网 之 家 ” 服 
务 ， 该 服务 是 高 科技 技术 与 援助 服务 和 保险 服务 有 机 结合 的 个 性 化 增值 服务 ， 客 户 可 以 利 
用 传感器 和 智能 手机 实现 对 自己 家 的 实时 监控 。 一 旦 家 中 发 生意 外 如 水 管 爆裂 ， 传 感 器 
不 仅 会 自动 通过 客户 的 智能 手机 通知 客户 ， 还 会 第 一 时 间 通 知 安 联 保险 公司 的 紧急 援助 
部 门 。 

而 对 企业 客户 ， 安 联 保险 公司 与 德意志 电信 合作 推出 具有 全 面 性 的 网 络 安全 解决 方案 
以 及 与 之 相 匹配 的 保险 产品 ， 继 而 向 其 企业 客户 提供 个 性 化 的 网 络 服务 和 保险 服务 的 产品 
组 合 。 例 如 ， 德 意志 电信 的 先进 网 络 防御 系统 与 安 联网 络 的 防护 保险 产品 相 结合 ， 在 为 客 
户 提供 智能 化 网 络 防御 系统 的 基础 上 ， 还 为 其 提供 了 最 高 承保 额 达 5000 万 欧元 的 保单 。 

与 此 同时 ， 安 联 还 积极 开展 安 联 全 球 合作 伙伴 项 目 (AWP)， 以 实现 其 生态 系统 的 构 
建 。 安 联 全 球 合作 伙伴 项 目 包括 安 联 全 球 救 援 和 全 球 汽车 、 安 联 全 球 护理 以 及 安 联 法 国 国 
际 健康 3 项 内 容 ， 能 够 帮助 安 联 保险 公司 实现 其 与 交通 、 医 疗 与 健康 等 领域 之 间 的 融通 与 
协调 ， 进 而 为 其 客户 提供 更 为 卓越 的 增值 服务 。 例如， 该 项 目 中 的 安 联 全 球 救 援 和 全 球 汽 
车 子 项 目 : 一 方面 ， 安 联 保险 公司 通过 与 汽车 厂商 签订 合同 ， 进 而 为 多 个 品牌 的 购车 客户 
提供 相应 的 车 辆 保险 产品 服务 。 另 一 方面 ， 安 联 保险 利用 其 庞大 且 有 效 的 服务 供应 商 网 
络 ， 为 其 客户 提供 汽车 道路 救援 服务 。 在 提供 道路 救援 服务 的 过 程 中 ， 安 联 保险 公司 还 通 
过 运用 大 数据 技术 对 事故 的 发 生 进行 充分 的 挖掘 和 分 析 ， 并 将 分 析 结 果 应 用 于 优化 其 保险 
产品 和 服务 ， 进 而 为 其 创造 更 大 效益 。 

(资料 来 源 : 《互联 网 + 时 代 大 数据 改良 与 改革 中 国保 险 业 》 之 五 技术 引发 商业 模式 新 变革 ) 


5.3.4 ”大 数据 精准 营销 在 保险 业 中 的 应 用 
1. 大 数据 与 车 险 精准 营销 


1) “车 险 精准 营销 

保险 公司 为 了 提高 其 在 车 险 市 场 中 的 竞争 地 位 ， 需 要 通过 精准 营销 将 潜在 的 车 险 需求 
转化 为 车 险 产 品 的 实际 购买 力 。 精 准 营销 的 实现 离 不 开 大 数据 技术 的 有 效应 用 ， 因 而 保险 
公司 要 将 大 数据 应 用 于 其 车 险 营销 的 全 过 程 。 

在 车 险 精准 营销 的 发 展 初期 ， 保 险 公 司 要 明确 其 车 险 精 准 营销 流程 和 机 构 设 置 ， 并 能 
够 通过 应 用 大 数据 技术 设计 出 基于 差异 化 定价 的 成 套 保险 产品 和 服务 ， 进 而 针对 不 同 车 险 
产品 进行 初步 的 宣传 和 推广 。 

在 车 险 精准 营销 的 发 展 中 期 ， 保 险 公 司 在 大 数据 技术 的 应 用 下 要 对 其 车 险 产 品 进行 进 
一 步 的 细 化 ， 并 利用 大 数据 挖掘 结果 对 其 车 险 产 品 的 研发 过 程 和 营销 模式 进行 优化 ， 不 断 
扩充 其 车 险 产品 和 服务 的 宣传 途径 和 营销 手段 。 

在 车 险 精 准 营销 的 发 展 后 期 ， 保 险 公 司 要 以 客户 体验 为 核心 目标 ， 应 用 大 数据 挖掘 的 
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结果 对 其 差异 化 的 车 险 产品 进行 再 创新 ， 对 其 车 险 产 品 的 营销 机 制 进行 不 断 完善 ， 进 而 使 
其 客户 满意 度 得 到 有 效 提升 。 

2) ”相关 案例 

一 直 以 来 ， 平 安 财 险 都 与 百度 搜索 保持 着 良好 的 合作 关系 。 当 用 户 在 百度 搜索 中 搜索 
关键 字 “ 车 险 ” 时， 平安 财 险 的 产品 宣传 就 会 出 现在 用 户 搜索 结果 页 面 中 的 显眼 位 置 。 
除 此 之 外 ， 平 安 财 险 还 利用 大 数据 技术 对 其 目标 客户 群体 一 一 车 主 的 相关 数据 进行 了 重新 
梳理 。 

平安 财 险 发 现 ， 在 车 主 周围 或 远 或 近 地 聚 集 着 汽车 厂商 、4S 店 、 汽 车 配件 厂商 、 交 通 
管理 部 门 、 加 油 站 、 导 航 服务 提供 商 、 保 险 公司 等 一 系列 组 织 机 构 ， 这 些 机 构 分 别 掌握 着 
与 车 主 以 及 投保 车 辆 相关 的 各 类 数据 。 因 此 ， 它 们 在 对 车 主 进行 研究 时 ， 突 破 了 传统 保险 
营销 的 局 限 性 ， 从 整个 产业 链 的 角度 对 车 主 的 车 险 需求 进行 分 析 和 判断 。 

平安 财 险 进而 从 车 主 购车 前 、 购 车 中 、 购 车 后 的 3 个 阶段 出 发 ， 绘 制 出 汽车 生命 周期 
的 问题 蓝图 。 该 问题 蓝图 清晰 地 展示 了 车 主 在 不 同 阶段 所 面临 的 不 同 问题 和 主要 保险 需 
求 。 例 如 ， 车 主 在 购车 阶段 会 考虑 车 险 、 购 车 贷款 、 经 销 商 、 车 牌 这 几 大 类 问题 ， 而 在 每 
一 大 类 问题 下 又 会 细 分 出 更 多 的 具体 问题 。 平 安 财 险 基于 其 对 车 主 在 不 同 阶段 的 特征 判 
断 ， 为 身 处 不 同 阶段 的 车 主 有 针对 性 地 推荐 车 险 产 品 ， 使 其 车 险 产品 的 销售 业绩 得 到 了 有 
效 的 提高 。 


2. 大 数据 与 健康 险 营销 


1) ”健康 险 精准 营销 

健康 险 精 准 营 销 的 思路 及 过 程 与 车 险 精准 营销 并 不 存在 太 大 的 不 同 ， 都 是 基于 大 数据 
分 析 和 挖掘 的 结果 了 解 其 客户 偏好 和 保险 需求 ， 进 而 有 针对 性 地 进行 营销 ， 以 实现 营销 效 
率 的 有 效 提 高 。 这 里 不 再 对 重复 的 内 容 进 行 殉 述 。 

健康 险 精准 营销 中 需要 特别 注意 的 问题 在 于 对 营销 时 机 的 把 握 。 人 们 的 健康 管理 是 一 
项 长 期 活动 ， 但 人 们 在 没有 患 病 恐 惧 时 通常 并 不 具有 购买 健康 险 的 行为 动机 ， 而 患 病 之 后 
购买 健康 险 也 不 再 具有 意义 。 因 而 健康 险 营销 的 最 佳 时 机 在 于 潜在 客户 具有 患 病 恐 惧 之 
时 ， 即 发 生 医疗 咨询 行为 之 时 。 随 着 移动 互联 网 技术 的 飞速 发 展 ， 网 上 医疗 咨询 凭借 其 便 
捷 性 已 成 为 人 们 进行 简单 医疗 咨询 的 主要 方式 。 保 险 公司 通 过 利用 大 数据 技术 能 够 了 解 其 
潜在 客户 的 健康 状况 和 主要 健康 顾虑 ， 进 而 向 特定 的 潜在 客户 有 针对 性 地 推荐 相应 的 健康 
险 产 品 ， 从 而 实现 健康 险 的 精准 营销 。 

2) ”相关 案例 

法 国 GMF 保险 公司 通过 利用 大 数据 技术 对 其 3 亿 潜 在 客户 的 相关 资料 进行 分 析 ， 建 
立 了 客户 全 生命 周期 的 价值 模型 ， 进 而 使 其 获取 新 客户 、 进 行 交叉 销售 和 追加 销售 的 效率 
得 到 了 极 大 的 提高 。 在 这 一 客户 数据 分 析 过 程 中 ，GMEF 保险 公司 将 其 自身 的 客户 数据 库 与 
第 三 方 的 客户 数据 和 人 口 统计 数据 相 结合 ， 利 用 其 建立 的 大 数据 分 析 平台 对 其 所 掌握 的 
数据 进行 处 理 ， 并 对 其 中 的 1500 多 个 变量 进行 了 不 同 角度 的 分 析 ， 进 而 从 中 找 出 了 各 种 
场景 下 保险 产品 销售 与 变量 之 间 的 相关 关系 ， 并 在 此 基础 上 制定 出 具有 针对 性 的 营销 推 
广 策略 。 


170 


大 数据 在 保险 业 中 的 应 用 大 第 5 章 


国内 的 泰康 人 寿 保险 公司 建立 了 语音 记录 的 大 数据 分 析 平 台 ， 对 其 客户 拨打 95522 的 
通话 进行 记录 和 分 析 ， 进 而 对 这 些 客户 进行 了 多 样 化 的 标签 划分 ， 如 老年 人 、 商 务 人 士 、 
大 学 生 、 和 运动员、 医生、 母亲、 孕妇 等 。 在 其 保险 销售 人 员 进 行 展业 时 ， 被 展业 客户 的 相 
关 标签 将 在 第 一 时 间 被 销售 人 员 获 取 ， 进 而 使 销售 人 员 能 够 以 合适 的 销售 方式 向 客户 有 针 
对 性 地 推荐 其 保险 产品 。 泰 康 人 寿 保险 公司 将 此 语音 分 析 结 构 与 其 营销 手段 相 结合 ， 创 造 
了 千 万 元 的 保费 收入 。 


(@) 54 Ea 


据 统 计 ， 保 险 公司 有 2/3 的 支出 被 使 用 在 理赔 处 理 和 赔款 支付 上 ， 而 作为 伴生 顽疾 的 
保险 欺诈 行为 仍 有 增 无 减 、 屡 见 不 鲜 。 恶 意 保险 欺诈 的 存在 不 仅 严重 损害 了 其 他 投保 人 所 
享有 的 正常 权益 ， 而 且 在 一 定 程度 上 制约 了 保险 服务 社会 的 功能 。 随 着 科学 技术 的 快速 
发 展 ， 保 险 公司 通过 大 数据 技术 能 够 使 其 理赔 处 理 、 损 失 预 防 和 欺诈 识别 的 能 力 得 到 有 
效 提高 。 


5.4.1 保险 欺诈 
1. 保险 欺诈 的 主要 表现 形式 


保险 欺诈 的 主要 表现 形式 有 以 下 几 种 类 型 。 

1) ”虚构 保险 标的 

即 投保 人 就 其 在 现实 中 并 不 存在 的 保险 标的 向 保险 公司 投保 ， 并 在 订立 保险 合同 后 谎 
报 该 保险 标的 发 生 盗 取 等 保险 事故 ， 向 保险 公司 骗取 相应 保险 赔款 的 欺诈 行为 。 该 欺诈 行 
为 多 发 生 于 财产 保险 领域 。 

2) 不 具有 可 保利 益 

即 投保 人 就 其 不 具有 可 保利 益 的 保险 标的 向 保险 公司 投保 ， 并 在 保险 合同 订立 后 积极 
促成 保险 事故 发 生 ， 进 而 骗取 相应 保险 赔款 的 欺诈 行为 。 该 欺诈 行为 多 发 生 于 人 寿 保 险 
领域 。 

3) ”标的 风险 状况 的 虚假 陈述 

即 投保 人 对 其 保险 标的 风险 状况 故意 向 保险 公司 隐瞒 或 做 虚假 告知 ， 进 而 使 保险 公司 
在 错误 判断 投保 人 风险 状况 的 基础 上 对 其 进行 承保 ， 一 旦 达到 风险 条 件 投保 人 就 可 以 从 保 
险 公司 获取 相应 保险 赔款 的 欺诈 行为 。 该 欺诈 行为 多 发 生 于 人 寿 保险 领域 。 

4) ”超额 投保 

即 投保 人 凭借 不 实 的 相关 单据 以 高 于 其 保险 标的 实际 价值 的 金额 向 保险 公司 进行 投 
保 ， 以 期 在 风险 事故 发 生 后 获得 额外 收益 的 欺诈 行为 。 

5) 重复 投保 

即 投保 人 就 同一 保险 标的 的 同一 保险 利益 在 2 个 或 2 个 以 上 保险 公司 进行 投保 ， 以 期 
在 风险 事故 发 生 后 获得 额外 收益 的 其 诈 行为 。 
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6) ”出 险 后 投保 

即 投保 人 在 特定 保险 事故 发 生 后 以 不 当 手 段 对 保险 事故 进行 掩盖 ， 进 而 向 保险 公司 投 
保 ， 以 期 就 已 发 生 的 保险 事故 保险 合同 成 立 后 获取 相应 保险 赔款 的 欺诈 行为 。 该 欺诈 行为 
多 发 生 于 人 寿 保险 领域 。 

7) 主观 故意 出 险 

即 投保 人 在 保险 合同 成 立 后 ， 带 有 主观 故意 性 地 促成 保险 事故 发 生 的 欺诈 行为 。 

8) ”虚假 保险 事故 

即 投保 人 的 保险 标的 在 保险 期 内 并 未 发 生 保险 事故 ， 但 投保 人 故意 制造 保险 标的 出 险 
的 假象 ， 以 期 获得 相应 保险 赔款 的 欺诈 行为 。 

9) ”夸大 损失 金额 

即 在 保险 标的 出 险 后 ， 被 保险 人 不 积极 对 损失 进行 合理 的 控制 ， 甚 至 进一步 加 重 损 
失 ， 以 期 获得 更 多 保险 赔款 的 欺诈 行为 。 


2. 保险 业 反 欺诈 工作 中 的 问题 


由 于 目前 我 国保 险 公司 的 反 坎 诈 体系 建设 较为 薄弱 ， 使 得 我 国保 险 坎 诈 现象 非但 没有 
得 到 遏制 ， 反 而 有 上 升 的 势头 。 目 前 我 国保 险 业 反 欺 诈 工 作 中 所 存在 的 问题 主要 表现 为 以 
下 几 个 方面 。 

1) ”对 反 欺 诈 工 作 的 基础 投入 不 足 
际 保险 监督 官 协会 (AIS) 的 经 验 数据 显示 ， 保 险 欺诈 事件 的 赔付 金额 约 占 总 赔付 金 
额 的 10% 一 20%。 但 在 大 多 数 保险 公司 中 ， 专 门 从 事 保险 反 欺 诈 工 作 的 人 员 数 量 不 足 全 体 
员工 数量 的 10%， 且 在 保险 公司 的 基层 分 支 机 构 中 从 事 反 欺诈 工作 的 人 员 数 量 更 少 。 

2) “未 形成 全 国 集中 的 反 其 诈 处 理 中 心 

虽然 大 多 数 保险 公司 都 已 在 其 内 部 建立 起 专门 负责 反 欺 诈 工 作 的 部 门 ， 但 不 同 地 区 的 
分 支 机 构 之 间 、 不 同 机 构 层 级 之 间 的 反 欺诈 工作 缺乏 协调 性 ， 相 关 风 险 数 据 也 并 未 在 部 门 
之 间 实 现 共享 。 由 于 诸多 保险 公司 内 部 尚未 形成 全 国 集中 的 反 欺诈 处 理 中 心 ， 因 而 保险 公 
司 对 于 跨 区 域 、 跨 机 构 的 欺诈 风险 缺乏 识别 能 力 。 

3) ”大 数据 分 析 的 思维 方式 缺失 

虽然 保险 公司 内 部 积累 着 海量 的 客户 基础 数据 ， 但 部 分 保险 公司 由 于 过 分 依赖 传统 的 
反 欺诈 工作 方式 且 缺 乏 大 数据 思维 ， 并 没有 利用 大 数据 技术 对 这 些 价值 数据 进行 有 效 的 分 
析 和 挖掘 ， 隐 藏 在 这 些 海量 数据 中 的 欺诈 线索 也 难以 被 发 现 。 

4) ”传统 风险 控制 体系 维度 简单 

在 保险 公司 传统 的 风险 控制 体系 中 ， 对 欺诈 风险 的 排查 大 多 是 通过 固定 的 程序 化 风险 
监测 模型 实现 的 。 由 于 传统 风险 监测 模型 的 维度 简单 且 样 本 数量 有 限 ， 致 使 模型 与 实际 风 
险 场景 之 间 的 匹配 程度 较 低 ， 监 测 欺诈 风险 的 能 力也 极为 有 限 。 

5) ”保险 公司 之 间 的 数据 共享 机 制 缺 失 

由 于 我 国保 险 市 场 的 竞争 较为 激烈 且 行 业内 部 尚未 建立 统一 的 信息 共享 平台 ， 因 而 各 
保险 公司 都 将 其 所 掌握 客户 信息 视 为 自己 的 核心 资产 而 不 愿 与 其 他 保险 公司 进行 数据 共 
享 。 这 也 使 得 同一 主体 的 保险 欺诈 行为 能 够 在 不 同 的 保险 公司 中 重复 发 生 。 
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6) ”法 律 制裁 不 力 、 犯 罪 成 本 低 

由 于 我 国 现行 法 律 对 保险 诈骗 行为 的 量刑 较 轻 ， 有 关 部 门 对 其 在 具体 实践 中 的 惩治 职 
责 认识 不 清 ， 导 致 我 国 对 保险 欺诈 行为 界定 不 准 、 惩 治 力度 有 限 ， 进 而 使 有 保险 欺诈 行为 
的 不 法 分 子 得 不 到 应 有 的 量 罪 和 制裁 。 而 较 低 的 犯罪 成 本 和 有 限 的 法 律 制裁 是 导致 保险 欺 
诈 事件 频 发 的 主要 外 部 原因 。 


5.4.2 大 数据 与 保险 反 欺 诈 
1. 大 数据 与 欺诈 识别 


由 于 保险 欺诈 具有 专业 性 和 隐蔽 性 的 特点 ， 因 而 保险 行业 内 部 主张 将 大 数据 技术 应 用 
于 欺诈 识别 工作 当中 的 呼声 日 渐 高 涨 ， 且 有 部 分 保险 公司 已 经 开始 了 大 数据 反 欺 诈 的 实践 。 

1) “大 数据 技术 的 优势 

由 于 保险 市 场 中 的 竞争 日 趋 激烈 ， 诸 多 保险 公司 都 在 努力 提高 自身 的 运营 效率 。 就 理 
赔 运 营 环节 来 讲 ， 保 险 公司 需要 在 有 效 欺 诈 识别 的 基础 上 实现 理赔 流程 的 精简 和 理赔 时 效 
的 提高 。 大 数据 技术 在 这 一 方面 有 很 好 的 应 用 前 景 。 

保险 公司 通过 运用 大 数据 技术 对 其 所 掌握 的 海量 客户 数据 进行 充分 的 分 析 和 挖掘 ， 能 
够 从 中 找 出 对 保险 欺诈 的 发 生 影响 最 为 显著 的 因素 ， 以 及 这 些 影 响 因素 的 取 值 区 间 ， 进 而 
构建 出 大 数据 保险 欺诈 识别 模型 。 保 险 公 司 的 理赔 人 员 能 够 通过 运用 大 数据 保险 欺诈 识别 
模型 对 每 个 具体 的 理赔 事件 进行 有 效 的 欺诈 风 险 评估 ， 进 而 依据 评分 的 高 低 对 是 否 立即 支 
付 理赔 金 、 是 否 进行 实地 勘查 等 问题 做 出 决策 。 

随 着 科学 技术 的 快速 发 展 ， 保 险 行业 中 已 出 现 针 对 理赔 事件 的 智能 勘查 系统 。 智 能 勘 
查 系 统 可 以 及 时 地 为 保险 公司 提供 与 保险 标的 出 险 状 况 相关 的 各 项 指标 数据 ， 进 而 帮助 理 
赔 人 员 从 中 找 出 异常 状况 并 及 时 采取 应 对 措施 。 

在 利用 大 数据 分 析 对 欺诈 风险 进行 监测 的 基础 上 ， 保 险 公司 的 理赔 运营 效率 和 客户 体 
验 能 够 得 到 有 效 提升 。 在 大 数据 应 用 的 背景 下 ， 保 险 公 司 能 够 对 实时 获取 的 保险 标的 出 险 
信息 进行 快速 分 析 ， 进 而 及 时 且 主 动 地 向 其 客户 提供 保险 理赔 服务 。 例 如 ， 客 户 在 驾驶 车 
辆 的 过 程 中 发 生 保险 事故 ， 保 险 公 司 通过 其 在 投保 车 辆 上 所 安装 的 车 载 信息 系统 能 够 及 时 
地 获取 出 险 报案 信息 ， 进 而 在 客户 提出 理赔 申请 之 前 主动 向 客户 提供 理赔 服务 以 及 更 多 适 
宜 的 增值 服务 。 

2) ”大 数据 反 欺诈 流程 

大 数据 反 欺诈 流程 如 图 5.10 所 示 。 从 图 5.10 中 我 们 可 以 看 出 ， 反 欺诈 工作 是 从 索赔 
人 在 保险 标的 出 险 后 提出 索赔 申请 (或 由 相关 具有 感知 能 力 的 信息 系统 发 出 实时 警报 代替 索 
赔 人 提出 申请 ) 开 始 的 。 

保险 公司 在 收 到 相关 申请 后 将 自动 进入 审核 环节 ， 即 利用 大 数据 技术 对 其 所 掌握 的 与 
投保 人 和 保险 标的 相关 的 基础 数据 、 由 智能 勘查 系统 及 时 反馈 的 与 出 险 状 况 相关 的 实时 数 
据 进 行 处 理 和 分 析 ， 对 引起 风险 事件 发 生 的 主要 因素 进行 识别 和 判断 。 在 这 一 环节 中 ， 智 
能 勘查 系统 能 够 向 保险 公司 提供 视觉 化 的 信息 并 为 其 揭示 潜在 的 犯罪 网 络 ， 进 而 帮助 保险 
公司 对 高 风险 索赔 给 予 必要 的 关注 。 
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接 下 来 ， 要 将 上 述 大 数据 分 析 的 结果 接 入 智能 欺诈 评估 系统 ， 进 而 对 该 项 理赔 案件 的 
炊 诈 风险 进行 评估 车 该 案件 评分 较 高 ， 则 做 出 直接 理赔 的 决策 ， 若 该 案件 评分 较 低 ， 则 
做 出 进一步 审核 (如 进行 人 工 实地 勘查 ) 的 决策 。 

入 助 大 数据 技术 对 海量 数据 的 快速 处 理 和 分 析 能 力 ， 基 于 该 反 欺 诈 流 程 的 坎 诈 识别 工 
作 十 分 高 效 ， 不 仅 使 审核 时 间 得 到 大 幅 缩短 ， 而 且 是 审核 的 准确 性 得 到 大 幅 提高 。 

数据 越 完整 多 样 ， 基 于 大 数据 技术 的 反 欺 诈 工作 效率 就 越 高 ， 即 数据 资源 的 可 靠 和 完 
整 是 大 数据 反 炊 诈 工作 高 效 进行 的 基础 。 因 此 ， 保 险 公司 要 对 理赔 历史 记录 、 保 单 信息 、 
医疗 保险 数据 、 事 故 统计 数据 、 征 信 记 录 、 犯 罪 记录 、 社 交 网 络 数据 等 相关 数据 信息 进行 
有 效 的 整合 和 存储 。 

【案例 5.4】 大 数据 对 保险 反 欺诈 工作 效率 的 提升 


南非 最 大 的 短期 保险 产品 供应 商 一 一 Santam 保险 公司 也 曾 被 保险 欺诈 所 困扰 。 最 初 
Santam 保险 公司 为 了 应 对 可 能 存在 的 保险 欺诈 ， 放 慢 了 其 理赔 处 理 速 度 一 一 用 至 少 3 天 的 
时 间 对 理赔 案件 进行 审核 ， 这 无 疑 使 Santam 保险 公司 良好 的 客户 服务 声誉 受到 严重 影 
响 。 之 后 Santam 保险 公司 开始 采用 基于 大 数据 的 欺诈 风险 分 析 和 解决 方案 ， 使 其 欺诈 识 
别 能 力 得 到 大 幅 提 高 。 在 该 系统 中 ，Santam 保险 公司 依据 其 已 经 确定 的 风险 因素 对 每 个 理 
赔 案件 进行 评估 ， 并 根据 理赔 案件 风险 程度 的 不 同 采取 不 同 处 理 方式 。Santam 保险 公司 借 
助 该 大 数据 欺诈 识别 系统 不 仅 节省 了 数 百 万 美元 的 保险 欺诈 损 失 ， 而 且 还 使 其 低 风险 理赔 
案件 的 处 理 时 效 得 到 有 效 提升 ， 绝 大 多 数 正常 的 理赔 案件 能 够 在 不 到 1 个 小 时 的 时 间 内 处 
理 完成 。 

美国 Allstate 保险 公司 利用 大 数据 技术 分 析出 保险 欺诈 的 潜在 规律 ， 进 而 使 其 理赔 其 


警惕 高 风险 索赔 


图 5.10 ”大 数据 反 欺 诈 流程 
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诈 的 损失 得 到 大 幅 降低 。Allstate 保险 公司 借助 大 数据 技术 对 理赔 数据 、 投 保 人 数据 、 相 关 
网 络 数据 和 揭发 者 数据 进行 有 效 的 整合 和 挖 据 ， 建 立 起 大 数据 欺诈 识别 系统 ; 进而 将 所 有 
理赔 请 求 首先 接 入 到 该 大 数据 欺诈 识别 系统 之 中 进行 自动 处 理 ， 然 后 再 将 可 疑 的 理赔 请 求 
交 由 特别 调查 部 门 进行 人 工 审阅 。Allstate 保险 公司 通过 利用 大 数据 技术 成 功 将 其 保险 欺诈 
发 生 率 降低 30%， 将 其 欺诈 识别 准确 率 提 高 50%， 并 将 其 理赔 成 本 节约 近 3%。 
(资料 来 源 : 甘肃 信息 网 ) 

2. 大 数据 反 欺 诈 工 作 的 重点 

1) ”对 相关 数据 进行 有 效 利用 

大 数据 时 代 背 景 下 ， 新 信息 技术 的 出 现 和 应 用 为 保险 公司 的 反 欺诈 工作 提供 了 更 多 的 
可 能 。 保 险 公司 大 数据 反 欺 诈 工 作 的 核心 就 是 对 相关 数据 进行 有 效 利用 。 

(1) 建立 信息 共享 机 制 。 

数据 是 保险 公司 进行 反 欺 诈 审查 的 基础 。 因 而 保险 公司 为 解决 信息 不 对 称 问 题 ， 要 利 
用 大 数据 技术 建立 信息 共享 平台 ， 为 其 进行 反 欺 诈 工作 黄 定 良好 的 基础 。 

(2) 管理 和 整合 相关 数据 。 

在 对 内 部 数据 进行 整合 的 基础 上 ， 保 险 公 司 还 要 积极 地 与 第 三 方 合作 以 获取 更 多 与 投 
保 人 和 保险 标的 相关 的 数据 ， 进 而 形成 对 业务 风险 更 准确 的 判断 。 保 险 公 司 要 对 其 所 掌 
握 的 相关 数据 进行 有 效 的 管理 和 整合 ， 以 在 保护 个 人 隐私 的 基础 上 实现 数据 价值 的 充分 
利用 。 

(3) 可 视 化 关联 分 析 技 术 。 

保险 公司 利用 大 数据 技术 对 海量 信息 数据 进行 专业 化 处 理 ， 能 够 以 直观 的 方式 将 承 
保 、 理 赔 、 客 户 等 相关 层面 的 数据 中 所 隐 含 的 信息 表现 出 来 ， 进 而 使 保险 公司 反 欺 诈 工 作 
的 脉络 更 加 清晰 和 明确 。 

(4) 对 信息 进行 量化 分 析 。 

在 获取 数据 并 对 数据 进行 整合 的 基础 上 ， 保 险 公司 通过 对 相关 数据 进行 量化 分 析 ， 能 
够 借助 预测 技术 建立 用 于 欺诈 识别 的 统计 分 析 模 型 。 在 将 各 例 理 赔 案 件 的 相关 数据 接 入 该 
欺诈 识别 模型 中 后 ， 保 险 公司 就 可 以 根据 模型 给 出 的 评分 来 判断 各 例 理 赔 案 件 中 的 欺诈 风 
险 。 数 据 在 反 欺 诈 工 作 中 的 应 用 流程 如 图 5.11 所 示 。 


量化 分 析 局 统计 模型 


创新 结构 
数据 


图 5.11 数据 在 反 欺诈 工作 中 的 应 用 流程 
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2) ”建立 科学 的 承保 和 理赔 规程 

为 有 效 地 控制 欺诈 风险 ， 保 险 公司 要 对 其 承保 和 理赔 环节 的 工作 机 制 和 流程 进行 优 
化 ， 将 反 欺 诈 工作 的 重心 从 被 动 的 事后 控制 转移 到 主动 的 事前 控制 之 上 。 

(1) 承保 环节 保证 质量 。 

为 从 源头 上 遏制 保险 其 诈 的 发 生 ， 保 险 公司 要 保证 其 承保 环节 工作 的 高 质量 。 保 险 公 
司 可 以 利用 大 数据 技术 量化 分 析 投 保 人 的 投保 动机 ， 进 而 在 订立 保险 合同 前 实现 对 投保 人 
的 欺诈 风险 评估 。 保 险 公司 还 要 建立 有 效 的 承保 审核 制度 、 信 息 沟 通 制 度 和 岗位 考评 制 
度 ， 为 高 质量 承保 的 实现 提供 制度 保证 。 

(2) 建立 两 级 勘查 制度 。 

即 在 对 理赔 申请 进行 审核 时 ， 对 于 欺诈 风险 评估 模型 给 出 较 低 评 分 的 理赔 申请 要 进行 
实地 勘查 ， 并 在 实地 勘查 过 程 中 严 保 查勘 质量 。 对 于 一 些 特殊 的 理赔 申请 ， 保 险 公司 还 应 
当 通 过 复 勘 来 提高 其 在 审查 环节 中 的 工作 质量 。 

(3) 建立 规范 的 理赔 制度 。 

保险 公司 要 建立 接 案 人 、 定 损人 、 理 算 人 、 审 核 人 和 审批 人 之 间 的 分 离 制度 以 及 实地 
勘查 人 员 之 间 的 制约 制度 ， 并 对 相关 风险 评估 数据 和 实地 勘查 报告 进行 有 效 的 存储 和 备 
份 。 此 外 ， 保 险 公 司 还 要 建立 严格 的 追 责 制 度 ， 一 旦 发 生 人 员 违 规 问题 必须 严肃 处 理 。 

3) ”强化 行业 内 部 协作 

(1) 全 面 推进 行业 信息 共享 。 

为 获取 更 多 的 客户 信息 ， 保 险 公司 可 以 在 保证 客户 隐私 和 相关 数据 安全 的 前 提 下 在 行 
业内 部 建立 统一 的 信息 共享 平台 ， 以 打破 各 保险 公司 之 间 的 数据 孤岛 。 将 分 散在 各 保险 机 
构 的 相关 数据 按 类 型 的 不 同 进行 分 类 存储 和 有 限 共享 ， 进 而 使 共享 数据 在 保险 反 欺 诈 工作 
中 的 内 在 价值 被 充分 释放 。 

(2) 制定 行业 大 数据 规划 。 

有 关 部 门 要 结合 大 数据 的 时 代 背 景 对 与 保险 反 欺 诈 工 作 相 关 的 法 律 法 规 进 行 完善 ， 进 
而 为 保险 公司 大 数据 反 欺诈 提供 良好 的 政策 环境 。 同 时 保险 业 协 会 要 对 行业 数据 标准 进行 
改进 和 补充 ， 以 保证 行业 共享 数据 的 质量 。 此 外 ， 还 要 建立 行业 数据 的 分 析 模 型 和 研究 框 
架 ， 并 建设 与 行业 大 数据 相配 套 的 数据 安全 防护 体系 。 

4) ”推进 保险 业 信用 体系 建设 

要 加 快 建立 保险 行业 内 部 的 统一 信用 平台 ， 对 投保 客户 以 及 从 业 人 员 的 信用 状况 进行 
记录 和 评价 。 基 于 “失信 惩戒 ”的 原则 ， 有 关 部 门 要 在 行业 内 部 建立 起 行业 黑 名 单 制度 以 
及 市 场 退出 机 制 ， 以 实现 对 失信 主体 的 有 效 约束 和 惩戒 。 


5.4.3 ”大 数据 与 车 险 反 欺诈 


1. 我 国 车 险 反 欺诈 工作 现状 


1) 市 场 整体 环境 层面 
近年 来 ， 我 国 车 险 市 场 中 频 发 的 欺诈 现象 严重 阻碍 了 车 险 市 场 的 有 序 、 健 康 发 展 。 为 
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保护 保险 消费 者 合法 权益 ， 切 实 防 范 和 化 解 保险 欺诈 风险 ， 中 国保 监 会 于 2012 年 8 月 出 
台 了 《关于 加 强 反 保险 欺诈 工作 的 指导 意见 》。 该 意见 指出 ， 各 保险 公司 和 保险 中 介 机 构 
内 部 应 针对 欺诈 风险 建立 反 欺诈 制度 机 制 。 

随 着 打击 力度 的 不 断 加 大 ， 车 险 欺 诈 行为 日 益 呈 现 出 多 样 且 隐 蔽 的 特点 ， 传 统 的 车 险 
欺诈 识别 方法 已 难以 对 相关 欺诈 风险 进行 防范 。 大 数据 技术 的 出 现 为 车 险 反 欺诈 工作 提供 
了 更 多 的 可 能 ， 保 险 公司 能 够 借助 大 数据 技术 从 海量 数据 中 识别 出 潜在 的 车 险 欺 诈 行为 ， 
并 有 针对 性 地 对 其 进行 防范 。 

2) ”行业 内 部 工作 层面 

从 保险 公司 具体 的 经 营 管理 层面 来 看 ， 目 前 我 国保 险 公司 采用 的 车 险 反 欺 诈 工 作 方 法 
主要 有 : 独立 调查 人 、 内 部 调查 人 、 相 关 费 用 审核 、 集 中 定 损 、 定 损 复 核 、 理 赔 审 核 、 数 
据 分 析 平 台 等 相关 反 欺 诈 方 法 。 其 中 ， 集 中 定 损 是 保险 公司 为 防范 欺诈 风险 对 其 业务 流程 
进行 优化 的 表现 ， 主 要 包括 快速 定 损 和 拆 检定 损 两 种 方式 ， 其 具体 的 业务 流程 如 图 5.12 
所 示 。 


确认 
车 辆 损失 损失 
安检 项 目 金额 


图 5.12 ”保险 公司 集中 定 损 的 业务 流程 


虽然 目前 已 有 个 别 保险 公司 建立 了 相对 完善 的 车 险 反 欺诈 机 制 ， 但 大 多 数 保险 公司 的 
车 险 反 欺 诈 工 作 仍 未 实现 专业 化 的 管理 和 运作 。 随 着 大 数据 时 代 的 到 来 ， 许 多 保险 公司 都 
在 借助 大 数据 技术 努力 提高 自身 的 车 险 反 欺诈 能 力 ， 并 取得 了 一 定 的 成 效 。 因 此 ， 我 们 可 
以 预见 在 不 远 的 将 来 ， 保 险 公司 的 车 险 反 欺诈 工作 将 会 实现 质 的 飞跃 。 

2. 车 险 欺诈 的 风险 识别 因子 


我 国 的 车 险 主要 有 机 动车 交通 事故 责任 强制 保险 ( 即 “ 交 强 险 ”) 和 商业 车 险 两 种 类 

型 ， 其 中 商业 车 险 又 可 分 为 基本 险 和 附加 险 两 种 类 型 。 从 车 险 涉及 主体 和 车 险 赔付 过 程 两 
个 方面 来 看 ， 车 险 欺诈 的 风险 识别 因子 包括 但 不 限于 如 图 5.13 所 示 的 30 个 识别 因子 。 
在 图 5.13 所 示 的 风险 识别 因子 涵盖 了 与 投保 人 、 驾 驶 员 、 保 险 公 司 从 业 人 员 、 投 保 车 
辆 、 投 保 车 辆 的 维修 厂商 以 及 保险 中 介 机 构 相 关 且 包含 一 定 欺 诈 风 险 信息 的 数据 指标 ， 以 
及 出 现在 车 险 经 营 过 程 ( 包 括 投保 、 出 险 、 勘 查 和 理赔 环节 ) 中 的 包含 一 定 欺诈 风险 信息 的 
数据 指标 。 以 这 些 指 标 为 基础 ， 能 够 建立 起 有 效 的 车 险 欺诈 风险 识别 模型 。 
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1. 投 保 金 额 1. 出 险 时 间 1. 是 否 第 三 方 报案 1. 实 际 索赔 金额 
2. 保 单 内 容 是 否 包含 | 2. 出 险 地 点 2. 报 案 时 间 与 出 险 2. 索 赔 时 间 与 出 险 
第 三 方 责任 险 3. 单 方 事故 有 无 现场 | ”时 间 间 隔 时 间 间 隔 

4. 事 故 是 否 涉及 被 ”| 3. 短 期 内 报案 、 销 案 、 

保险 人 家 属 再 报案 

5. 勘 查 员 是 否 赶 赴 | 4. 出 险 时 间 与 保单 

现场 到 期 时 间 间 隔 

6. 车 辆 损 清单 中 韭 ”| 5. 被 保险 人 能 否 提供 

标的 车 辆 数 目击 证 人 


人 出 面 索赔 


图 5.13 ”车险 欺诈 的 风险 识别 因子 

3. 车 险 欺诈 识别 的 理论 模型 

在 大 数据 的 时 代 背 景 下 ， 基 于 海量 数据 所 建立 起 的 车 险 欺诈 识别 系统 能 够 对 车 险 欺诈 
风险 进行 有 效 的 识别 和 防范 。 因 而 保险 公司 为 提高 其 在 车 险 反 欺 诈 工 作 中 的 能 力 和 效率 ， 
要 在 其 内 部 建立 起 完善 的 车 险 欺 诈 识 别 系统 ， 以 对 其 所 掌握 的 信息 数据 进行 充分 利用 。 基 
于 前 文 所 述 车 险 欺 诈 的 风险 识别 因子 ， 可 以 建立 车 险 欺诈 识别 的 理论 模型 ， 如 图 5.14 所 示 。 

4. 车 险 反 欺诈 防范 对 策 

1) ”构建 跨行 业 的 客户 信用 数据 库 

各 保险 公司 内 部 都 存储 着 一 定 的 客户 信用 数据 ， 但 各 保险 公司 之 间 由 于 缺乏 信息 共享 
机 制 ， 其 对 客户 信用 状况 的 评估 和 把 握 仍 不 够 准确 。 此 外 ， 其 他 行业 中 也 存储 着 诸多 与 车 
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念 欺 诈 行 为 具有 相关 性 的 数据 ， 对 这 些 外 部 数据 加 以 利用 能 够 有 效 地 提高 保险 公司 对 车 险 
欺诈 的 识别 和 防范 能 力 。 因 此 ， 要 在 保护 客户 隐私 安全 的 基础 上 ， 建 立 涵盖 相关 内 外 部 数 
据 且 能 够 在 行业 内 部 实现 共享 的 客户 信用 数据 库 。 


关联 主体 防范 数据 库 


由 人 | 医疗 领域 欺诈 

及 索赔 信息 | 数据 库 

保险 领域 欺诈 
数据 库 


数据 识别 
因子 提取 


图 5.14 车 险 欺 诈 识别 的 理论 模型 


2) ”推广 使 用 车 载 信息 系统 

由 于 实时 数据 能 够 帮助 车 险 欺诈 识别 工作 实现 动态 调整 ， 保 险 公 司 在 对 车 险 欺诈 风险 
进行 识别 时 ， 除 了 要 利用 内 部 存量 数据 和 相关 外 部 数据 ， 还 应 当 考 虑 借助 车 载 信息 系统 获 
取 与 投保 车 辆 相关 的 实时 数据 并 加 以 利用 。 因 而 保险 公司 在 进行 车 险 承 保 时 ， 要 以 合理 的 
方式 和 手段 鼓励 其 车 险 客户 安装 和 使 用 车 载 信息 系统 。 

3) ”建立 全 国 性 的 车 险 反 欺 诈 联动 机 制 

为 更 有 效 地 开展 车 险 反 欺诈 工作 ， 要 在 保险 业 监 管 部 门 和 自律 组 织 、 保 险 公司 、 交 通 
管理 部 门 、 相 关 科 研 机 构 等 相关 主体 之 间 建 立 全 国 性 的 车 险 反 欺诈 联动 机 制 ， 从 而 实现 对 
车 险 欺 诈 风 险 的 多 角度 识别 和 全 方位 防范 。 
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5.4.4 ”大 数据 与 健康 险 的 理赔 风险 
1. 健康 险 中 的 理赔 风险 


1) “健康 险 的 发 展 困境 

近 些 年 来 ， 我 国 的 商业 健康 险 在 高 速 发 展 。 根 据 保 监 会 的 统计 数据 显示 ， 我 国 2016 
年 前 三 季度 商业 健康 险 的 原 保险 保费 收入 为 3430.41 亿 元， 同比 增长 86.77%。 虽 然 我 国 商 
业 健 康 险 有 着 良好 的 发 展 态势 ， 但 从 事 商 业 健 康 险 业 务 的 保险 公司 大 多 仍 未 实现 盈利 。 究 
其 原因 ， 主 要 有 以 下 两 个 方面 。 

(1) 目前 保险 行业 内 部 对 商业 健康 险 的 市 场 定位 尚 待 进一步 明确 ， 从 事 商 业 健康 险 业 
务 的 保险 公司 尚未 走 上 专业 化 的 发 展 道路 。 

(2) 保险 公司 与 医院 等 医疗 机 构 之 间 存 在 信息 不 对 称 ， 进 而 导致 其 难以 对 医疗 费用 的 
赔付 风险 进行 控制 。 相 关 赔 付 成 本 的 居 高 不 下 正 是 阻碍 商业 健康 险 良好 发 展 的 突出 问题 。 

2) ”健康 险 中 的 理赔 风险 

商业 健康 险 中 的 理赔 风险 主要 包括 客户 的 欺诈 风险 和 医疗 机 构 的 过 度 医疗 风险 。 其 
中 ， 医 疗 机 构 的 过 度 医 疗 风 险 最 为 突出 。 

客户 的 欺诈 风险 在 商业 健康 险 中 并 不 是 主要 风险 ， 但 一 旦 出 现 便 涉及 较 大 的 金额 。 商 
业 健 康 险 中 的 客户 欺诈 行为 与 其 他 险种 中 的 客户 欺诈 行为 在 本 质 上 并 不 存在 较 大 的 不 同 
因此 ， 商 业 健 康 险 中 的 反 欺 诈 工 作 在 内 容 和 流程 上 也 与 其 他 险种 类 似 。 在 大 数据 应 用 的 背 
景 下 ， 通 过 对 多 类 型 的 海量 客户 数据 进行 充分 的 分 析 和 挖掘 ， 保 险 公司 能 够 用 模型 来 刻画 
商业 健康 险 中 客户 欺诈 行为 ， 进 而 高 效 地 对 每 一 例 理 赔 案 件 进行 审查 并 快速 做 出 适当 的 行 
为 决策 。 

医疗 机 构 的 过 度 医疗 风险 作为 商业 健康 险 中 的 主要 风险 ， 是 由 保险 公司 与 相关 医疗 机 
构 之 间 的 信息 不 对 称 所 造成 的 。 过 度 医疗 行为 包括 但 不 限于 : 药品 用 量 超 标 、 用 药 与 患者 
实际 医疗 需求 不 匹配 、 医 疗 服 务 的 非 合 理 收 费 、 药 品 的 非 合 理 定价 、 基 于 保障 方案 的 非 必 
要 医疗 行为 等 ( 见 图 5.15)。 相 关 医 疗 机 构 的 过 度 医疗 行为 导致 保险 公司 对 其 所 承保 的 相关 
医疗 费用 负担 着 极 高 的 赔付 成 本 。 据 公开 信息 显示 ， 仅 由 药品 用 量 超 标 和 非 必要 医疗 行为 
两 项 所 导致 的 保费 资源 浪费 就 达到 了 20% 一 30%， 再 加 上 药品 非 合 理 定价 、 医 疗 服务 的 非 
合理 收费 等 其 他 过 度 医疗 行为 的 影响 ， 保 险 资源 的 浪费 比例 高 达 50% 以 上 。 因 此 ， 经 营 商 
业 健 康 险 业务 的 保险 公司 要 想 在 该 业务 中 实现 盔 利 ， 就 必须 对 其 所 面临 的 过 度 医疗 风险 进 
行 合 理 且 有 效 的 控制 。 而 医疗 信息 数据 正 是 对 过 度 医 疗 风险 进行 有 效 控制 的 关键 。 

2. 大 数据 与 健康 险 的 理赔 风险 控制 

大 数据 时 代 的 到 来 ， 为 保险 公司 对 其 商业 健康 险 业 务 中 的 相关 理赔 风险 进行 有 效 控制 
提供 了 数据 基础 和 实现 途径 。 

1) “与 医疗 大 数据 相 结合 

商业 健康 险 的 核心 是 医疗 服务 。 随 着 我 国 的 医疗 信息 化 建设 的 逐渐 深入 和 医疗 数据 库 
体系 的 不 断 完善 ， 与 具体 医疗 服务 相关 的 数据 资源 将 会 被 有 效 地 获取 和 整合 ， 进 而 使 保险 
公司 与 客户 和 医疗 机 构 之 间 的 信息 不 对 称 问 题 得 以 解决 。 因 此 ， 保 险 公 司 要 把 握 时 机 ， 积 


180 


大 数据 在 保险 业 中 的 应 用 大 第 5 章 


极 向 有 关 部 门 争取 接 入 医疗 数据 库 的 机 会 。 此 外 ， 鉴 于 医院 是 医疗 大 数据 获取 的 关键 卡 
位 ， 保 险 公司 还 应 加 强 与 医院 之 间 合 作 ， 进 而 实现 对 客户 健康 状况 和 医疗 行为 的 精准 把 
握 。 总 而 言 之 ， 保 险 公司 应 主动 顺应 大 数据 的 时 代 潮 流 ， 尽 可 能 多 地 开发 数据 获取 渠道 ， 
以 提高 其 风险 识别 的 准确 性 。 


不 合理 用 药 


横向 滥用 


5.15 过度 医疗 行为 


2) “合理 评估 医疗 费用 和 质量 

在 获取 海量 医疗 数据 的 基础 上 ， 保 险 公司 可 以 利用 大 数据 分 析 技 术 对 相关 医疗 行为 的 
费用 和 质量 做 出 科学 合理 的 评估 。 

由 于 具体 的 医疗 服务 行为 难以 被 标准 化 ， 因 而 保险 公司 难以 对 医疗 费用 的 合理 性 做 出 
准确 的 评估 。 例 如 在 心脏 支架 手术 中 ， 进 行 哪些 方面 的 化 验 检 查 、 采 用 何 种 麻醉 方式 、 使 
用 哪 种 心脏 支架 、 支 架 的 放置 数量 、 术 后 需要 多 久 的 康复 期 、 康 复 期 内 需要 接受 哪些 化 验 
检查 等 问题 ， 都 会 因 患者 的 身体 状况 和 经 济 能 力 的 不 同 而 存在 差异 。 结 合 医疗 服务 行为 的 
这 一 特点 ， 保 险 公 司 可 以 借助 大 数据 技术 找 出 同一 疾病 相关 诊疗 项 目 与 用 药 情况 之 间 的 相 
关 性 ， 以 专业 的 分 组 方法 对 相关 诊疗 费用 的 标准 进行 评估 。 

而 对 医疗 质量 的 评估 ， 保 险 公司 可 以 从 医疗 过 程 评估 和 医疗 结果 评估 两 个 方面 进行 。 
保险 公司 可 以 通过 利用 大 数据 技术 对 海量 的 医疗 临床 数据 进行 分 析 和 挖掘 ， 进 而 准确 地 判 
断 出 在 不 同 疾病 的 诊疗 过 程 中 哪些 医疗 行为 是 必需 的 、 哪 些 医疗 行为 是 不 合理 的 、 所 用 药 
物 是 否 是 合理 的 、 用 药剂 量 是 否 是 合理 的 等 ， 即 实现 对 医疗 过 程 的 评估 。 保 险 公司 还 可 以 
通过 利用 大 数据 技术 对 海量 的 康复 期 数据 进行 分 析 和 挖掘 ， 进 而 对 术 后 不 良 事 件 发 生 率 、 
疾病 复发 率 等 相关 指标 进行 判断 ， 即 实现 对 医疗 结果 的 评估 。 

3) ”大 数据 与 健康 险 风险 管理 

如 图 5.16 所 示 ， 通 过 利用 大 数据 技术 对 以 病历 为 中 心 的 相关 医疗 数据 进行 挖掘 ， 保 险 
公司 能 够 基于 不 同 患者 的 具体 健康 体征 和 主要 症状 ， 对 诊疗 过 程 中 所 发 生 的 相关 医疗 行为 
进行 有 效 核查 ， 进 而 实现 对 赔付 金额 的 合理 控制 。 
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图 5.16 大 数据 与 健康 险 风险 管理 
目前 国内 已 有 部 分 保险 公司 开始 了 在 健康 险 中 应 用 大 数据 技术 的 实践 。 例 如 ， 太 平 洋 


团 旗下 的 太保 安 联 健康 保险 公司 通过 与 阿里 健康 进行 合作 ， 将 阿里 健康 所 掌握 的 海 
、 风 险 控制 引擎 和 人 脸 识别 防伪 等 技术 接 入 其 理赔 环节 ， 使 其 控 费 能 力 得 到 有 效 的 


本 章 总 结 


大 数据 保险 是 指 保险 公司 通过 利用 大 数据 技术 对 风险 数据 进行 分 析 、 处 理 和 挖 
据 ， 使 风险 数据 实现 有 效 的 价值 变现 。 在 此 基础 上 保险 公司 通过 其 治理 端 和 商业 
端的 协同 创新 ， 使 传统 的 保险 服务 方式 和 资源 配置 方式 得 以 优化 ， 从 而 实现 保险 
产品 、 保 险 服务 和 保险 业务 模式 的 创新 ， 进 而 更 好 地 满足 其 客户 需求 并 提供 更 为 
优质 的 保险 服务 。 

在 金融 领域 中 ， 保 险 行业 应 用 大 数据 相对 较 晚 ， 应 用 水 平 也 落后 于 银行 业 和 证 券 
业 。 这 是 因为 银行 业 与 证 券 业 的 数据 服务 平台 建设 较 早 ， 从 而 为 大 数据 技术 的 应 
用 葛 定 了 良好 的 基础 ， 而 保险 业 的 数据 服务 平台 建设 则 相对 较 晚 。 而 就 保险 业 自 
身 的 大 数据 应 用 阶段 而 言 ， 目 前 尚且 处 于 大 数据 应 用 的 初级 阶段 ， 即 内 部 循环 阶 
段 。 因 而 接 下 来 保险 业 需 要 通过 合理 利用 其 内 部 数据 并 引入 更 多 的 外 部 数据 来 拓 
展 大 数据 分 析 在 本 行业 中 的 应 用 领域 。 

保险 公司 的 承保 定价 能 力 是 其 在 同业 竞争 中 的 核心 竞争 力 。 在 大 数据 技术 的 应 用 
下 ， 保 险 公司 过 去 的 样本 精算 将 升级 为 全 量 精算 ， 风 险 定价 模式 将 发 生 很 大 的 改 
变 。 通 过 应 用 大 数据 技术 ， 传 统 的 保险 精算 中 将 引入 更 多 的 定价 因素 ， 保 险 公司 
能 够 根据 客户 的 特定 风险 来 调整 承保 定价 ， 不 仅 能 够 使 客户 的 差异 化 需求 得 到 满 
足 ， 还 能 使 保险 公司 的 承保 风险 得 到 降低 ， 从 而 达到 客户 和 保险 公司 双方 共 赢 的 
目的 。 

保险 公司 在 大 数据 背景 下 对 客户 保险 需求 进行 分 析 时 ， 相 关 的 数据 来 源 不 再 仅 限 
于 保险 行业 内 部 的 保险 客户 数据 ， 还 包括 保险 体系 以 外 的 数据 ， 包 括 与 保险 公司 
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进行 合作 的 第 三 方 自身 所 积累 的 客户 数据 、 网 络 社交 平台 所 积累 的 客户 数据 等 。 
在 对 客户 信息 和 客户 行为 的 相关 数据 进行 深度 分 析 的 基础 上 ， 保 险 公司 能 有 效 地 
预测 客户 需求 、 挖 掘 潜在 客户 并 向 其 推荐 适当 的 保险 产品 ， 从 而 实现 个 性 化 的 精 
准 营 销 。 

@ ”保险 公司 通过 运用 大 数据 技术 对 其 所 掌握 的 海量 客户 数据 进行 充分 的 分 析 和 挖 
据 ， 能 够 从 中 找 出 对 保险 欺诈 的 发 生 影响 最 为 显著 的 因素 ， 以 及 这 些 影响 因素 的 
取 值 区 间 ， 进 而 构建 出 大 数据 保险 欺诈 识别 模型 。 保 险 公司 的 理赔 人 员 能 够 通过 
运用 大 数据 保险 欺诈 识别 模型 对 每 个 具体 的 理赔 事件 进行 有 效 的 欺诈 风险 评估 ， 
进而 依据 评分 的 高 低 对 是 否 立 即 支付 理赔 金 、 是 否 进行 实地 勘查 等 问题 做 出 
决策 。 


. 简 述 大 数据 保险 的 概念 、 特 征 应 用 阶段 。 

. 大 数据 在 保险 行业 中 有 哪些 作用 ? 

. 大 数据 背景 下 的 数据 服务 架构 与 传统 数据 服务 架构 有 哪些 区 别 ? 

. 大 数据 是 如 何 帮助 保险 公司 实现 承保 定价 能 力 提升 的 ? 

. 简 述 基于 OBD+UBI 的 车 险 费 率 厘 定 方式 。 

. 大 数据 时 代 产 生 了 哪些 保险 新 营销 方式 ?保险 公司 又 该 如 何 提 高 其 精准 营销 能 力 ? 
. 什么 是 重 直 平台 生态 圈 ? 构建 的 动因 有 哪些 ? 

. 大 数据 是 如 何 帮助 车 险 和 健康 险 实 现 精准 营销 的 ? 

9. 保险 欺诈 有 哪些 形式 ?保险 公司 如 何 利用 大 数据 开展 保险 反 欺 诈 工 作 ? 

10. 阐述 大 数据 在 车 险 和 健康 险 领域 中 是 如 何 帮 助 保险 公司 进行 理赔 风险 控制 的 。 
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@ 了 解 如 何 用 大 数据 技术 对 第 三 @ 掌握 大 数据 技术 在 互联 网 供应 
方 支付 中 的 欺诈 风险 进行 风险 链 金 融 中 的 应 用 
防范 @ 熟悉 大 数据 在 互联 网 消费 金融 
@ 掌握 大 数据 技术 在 网 络 借贷 中 中 的 应 用 
的 应 用 


互联 网 金融 是 金融 行业 的 后 起 之 秀 ， 它 的 出 现 打破 了 传统 金融 行业 的 格局 ， 也 
正 渐 渐 地 改变 着 人 们 的 生活 方式 。 它 以 互联 网 技术 为 依托 ， 将 金融 服务 线 上 化 ， 推 
动 了 金融 产品 创新 ， 但 是 由 此 产生 的 风险 也 是 不 可 忽视 的 。 而 大 数据 技术 的 应 用 很 
好 地 解决 了 这 个 问题 ， 同 时 也 解释 了 互联 网 金融 为 什么 能 受 大 众 欢 迎 而 传统 金融 机 
构 失 宠 的 问题 。 本 章 从 第 三 方 支付 、 网 络 借贷 、 互 联网 供应 链 人 金融、 互联 网 消费 金 
融 等 方面 着 手 ， 通 过 各 个 典型 的 案例 介绍 互联 网 金融 中 的 大 数据 应 用 。 


大 数据 金融 与 征 信 


ee” 


(OJ 二 基于 大 数据 的 第 三 方 支付 欺诈 风险 管理 


6.1.1 第 三 方 支付 中 的 欺诈 风险 


欺诈 风险 是 第 三 方 支付 机 构 面临 的 主要 外 部 风险 。 由 于 第 三 方 支付 依托 于 互联 网 和 电 
子 商务 ， 而 目前 我 国 存在 较为 严重 的 网 络 漏洞 ， 信 息 安全 没有 得 到 有 效 的 防护 ， 这 给 不 法 
分 子 带 来 了 犯罪 的 空间 。 在 这 种 虚拟 环境 下 ， 不 法 分 子 更 容易 伪装 自己 的 身份 进行 交易 ， 
欺骗 消费 者 。 

基于 第 三 方 支付 的 欺诈 行为 主要 包括 以 下 两 种 形式 。 

第 一 种 ， 不 法 分 子 通 过 木马 病毒 等 方式 在 消费 者 不 知情 的 情况 下 ， 侵 入 消费 者 的 第 三 
方 支付 客户 端 盗 取 相关 信息 ， 从 而 实现 资金 盗 取 ,产生 欺 诈 风 险 。 这 种 诈骗 方式 需要 以 一 
定 的 计算 机 技术 为 支撑 ， 但 诈骗 行为 一 旦 发 生 ， 消 费 者 就 很 难 在 事前 察觉 ， 也 很 难 在 事后 
挽回 损失 。 

第 三 种 ， 不 法 分 子 的 欺诈 行为 是 利用 消费 者 自身 的 防 骗 意识 较 弱 得 以 实现 的 。 一 方 
面 ， 不 法 分 子 通过 注册 一 家 网 店 ， 然 后 推出 一 些 优惠 活动 吸引 消费 者 参与 ， 并 告知 若 想 参 
与 此 活动 只 能 通过 打开 所 给 链接 或 者 扫描 所 给 二 维 码 进行 支付 ， 从 而 诱 使 消费 者 付款 。 另 
外 一 方面 ， 不 法 分 子 是 以 第 三 方 支付 机 构 的 名 义 给 消费 者 发 邮件 或 信息 ， 以 用 户 的 账号 密 
码 不 安全 或 者 补充 个 人 信息 等 为 由 ， 通 过 窃取 消费 者 的 账户 信息 来 实现 其 欺诈 行 为 。 

目前 随 着 网 络 交易 的 丰富 ， 各 式 各 样 的 欺诈 形式 层出不穷 ， 其 本 身 大 都 与 第 三 方 支付 
机 构 无 关 ， 但 是 不 法 分 子 正 是 利用 消费 者 对 第 三 方 支付 机 构 的 信任 或 第 三 方 支付 机 构 本 身 
运作 时 存在 的 漏洞 进行 不 法 行为 ， 最 终 使 消费 者 蒙受 损失 。 

欺诈 风险 存在 的 本 身 不 是 第 三 方 支付 机 构 违规 行为 导致 的 ， 但 欺诈 风险 的 蔓延 会 打击 
消费 者 的 信心 ， 严 重 危 及 第 三 方 支付 行业 的 市 场 形象 。 现 阶段 ， 国 内 的 第 三 方 支付 机 构 对 
此 类 事件 的 发 生 都 设 有 相关 的 免责 条 款 ， 以 支付 宝 为 例 ， 其 明文 规定 : “本 公司 对 您 所 交 
易 的 标的 物 不 提供 任何 形式 的 鉴定 、 证 明 的 服务 。 ”这 意味 着 它 本 身 不 承担 相关 的 监督 责 
任 。 此 外 ， 由 于 对 第 三 方 支付 机 构 业 务 操 作 的 具体 流程 没有 相关 规定 ， 导 致 无 法 对 其 注册 
用 户 的 信息 进行 有 效 的 核实 和 管理 ， 这 也 使 得 不 法 分 子 能 够 利用 虚假 信息 来 实现 网 络 
欺诈 。 

但 是 基于 电子 商务 的 虚拟 性 、 复 杂 性 ， 第 三 方 支付 机 构 有 责任 采取 更 为 有 效 的 措施 ， 
包括 风险 识别 、 安 全 认证 、 建 立 健全 垫付 与 追偿 制度 等 ， 防 范 和 化 解 欺诈 风险 ， 切 实 维护 
消费 者 的 权益 和 第 三 方 支付 机 构 的 信誉 和 安全 。 坎 诈 风 险 的 发 生 不 仅 会 影响 消费 者 的 交 
易 ， 也 会 破坏 健康 有 序 的 交易 秩序 ， 对 第 三 方 支付 机 构 本 身 也 有 很 大 的 影响 。 因 此 ， 欺 
诈 风 险 也 是 第 三 方 支付 平台 在 运营 过 程 中 需要 解决 的 一 个 难题 。 


6.1.2 ”大 数据 应 用 与 欺诈 风险 防范 


对 第 三 方 支付 平台 而 言 ， 大 数据 是 它 浑然 天 成 的 优势 。 一 方面 ， 第 三 方 支付 涉及 资金 
交易 ， 它 在 客户 注册 使 用 时 便 可 采集 到 客户 的 基本 个 人 资料 ， 如 个 人 信息 、 身 份 证 信息 、 
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银行 卡 信息 、 财 产 信息 等 。 这 些 数据 通常 被 认为 是 非常 有 价值 而 且 是 较 难 获取 的 。 另 一 方 
， 第 三 方 支付 在 十 几 年 的 发 展 过 程 中 ， 不 断 积累 客户 的 海量 历史 支付 信息 本 身 就 是 大 数 
据 。 这 些 大 数据 具有 体 量 大 、 和 覆盖 全 、 质 量 高 的 特点 。 第 三 方 平台 完全 可 以 利用 好 已 有 的 
大 数据 ， 从 而 进行 大 数据 风 控 ， 防 范 欺 诈 风 险 。 

具体 而 言 ， 第 三 方 支付 公司 运用 计算 机 技术 ， 建 设 一 个 云端 的 动态 数据 库 ， 数 据 库 中 
储存 和 记录 着 客户 的 基本 个 人 信息 和 交易 信息 。 之 后 通过 已 有 的 数据 进行 科学 的 管理 、 合 
理 的 分 类 ， 并 通过 一 定 的 算法 建立 风险 控制 模型 。 

大 数据 风 控 更 侧重 云端 实时 风险 分 析 ， 通 过 对 用 户 行为 数据 的 关联 分 析 发 现 蛛 丝 马 
迹 ， 从 而 阻止 欺诈 的 进一步 发 生 。 它 的 亮点 在 于 ， 即 便 客户 已 经 处 于 不 安全 状态 ， 比 如 用 
户 因 木 马 钓鱼 等 原因 导致 账户 密码 等 信息 已 发 生 泄露 ， 经 过 云端 的 数据 关联 分 析 也 能 判断 
账户 是 否 异 常 ， 并 立即 做 出 反馈 。 

大 数据 技术 对 第 三 方 支付 欺诈 风险 防范 的 应 用 ， 主 要 从 以 下 4 个 场景 展开 分 析 。 


1. 注册 场景 


注册 场景 中 主要 面临 垃圾 注册 的 欺诈 风险 。 详 细 地 说 ， 就 是 欺诈 者 可 能 会 在 菜 一 个 第 
三 方 支付 平台 上 注册 很 多 账号 ， 而 这 些 账号 通常 不 会 有 实际 的 交易 ， 是 一 堆 “ 空 号 ”。 坎 
诈 者 这 么 做 可 能 出 于 两 种 目的 。 第 一 ， 第 三 方 支付 平台 可 能 通过 营销 活动 吸引 新 注册 用 
户 ， 如 注册 送 红 包 、 优 惠 券 、 礼 品 等 (大 多 以 红包 为 主 )。 而 欺诈 者 正 是 利用 这 种 活动 ， 通 
过 注册 多 个 账户 “ 聚 沙 成 塔 ”， 以 此 获 利 。 第 二 ， 欺 诈 者 通过 注册 多 个 账户 ， 很 有 可 能 是 
为 后 续 的 洗钱 、 盗 卡 、 诈 骗 等 欺诈 行为 埋 下 伏笔 。 

在 注册 场景 下 ， 存 在 的 欺诈 风险 有 以 下 两 个 特征 。 

(1) 一 般 地 ， 互 联网 企业 都 会 在 用 户 注册 界面 设置 图 片 验 证 码 ， 以 对 注册 者 进行 “人 
机 图 灵 测 试 ”， 即 判断 注册 者 到 底 是 人 还 是 机 器 ， 以 防止 恶意 的 注册 行为 。 然 而 这 种 方式 
也 存在 着 一 定 的 漏洞 。 因 为 目前 市 场 上 已 经 存在 这 样 一 个 黑色 产业 链 ， 欺 诈 者 通过 雇佣 劳 
动力 ， 让 受 雇 人 进行 有 偿 的 识别 验证 码 的 工作 。 在 这 种 情况 下 ， 图 片 验证 码 显 然 形 同 
虚设 。 

(2) 当 用 户 进行 第 三 方 支付 的 账号 注册 时 ， 一 般 需 要 进行 手机 号 验证 并 绑 定 ， 旨 在 限 
制 单个 客户 注册 的 账号 数 ， 防 止 一 人 多 号 的 现象 。 而 市 场 上 存在 着 专门 设 定 虚拟 手机 号 码 
以 进行 验证 的 收 码 平台 。 欺 诈 者 完全 可 以 通过 该 平台 以 廉价 的 方式 获取 非常 多 的 虚假 手机 
号 进行 注册 ， 且 通过 收 码 平 台 接收 提供 虚拟 账号 短信 验证 码 ， 欺 诈 者 可 以 轻松 绕 过 手机 短 
信 验 证 码 环节 。 

针对 上 述 欺 诈 风 险 ， 第 三 方 支付 平台 可 以 运用 大 数据 技术 ， 利 用 云端 的 数据 库 ， 分 析 
用 户 注 册 行 为 是 否 存 在 异常 。 例 如 ， 看 注册 者 注册 来 源 请 求 的 了 P 地 址 是 否 是 代理 、 同 一 个 
设备 上 发 起 的 注册 行为 是 否 过 于 频繁 ， 此外， 平台 可 以 通过 外 部 的 或 者 自 有 虚假 手机 号 码 
数据 库 进行 识别 ， 并 建立 一 个 定期 的 清洗 机 制 ， 确 保 数据 的 精准 性 。 


2. 登录 场景 


在 第 三 方 支付 平台 的 登录 场景 中 ， 主 要 面临 账户 盗用 以 及 接 库 的 欺诈 风险 。 
首先 ， 对 于 账户 盗用 风险 ， 往 往 用 户 是 因 木马 钓鱼 或 互联 网 泄露 数据 等 各 种 不 安全 操 
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作 ， 导 致 持 有 的 账号 密码 信息 被 盗 取 。 坎 诈 者 在 获取 账号 密码 信息 后 ， 会 尝试 越权 登录 访 
问 用 户 支付 后 台 页 面 ， 进 而 发 起 盗 卡 交易 行为 ， 如 购置 虚拟 商品 等 ， 导 致 用 户 账户 资金 损 
失 。 此 外 ， 越 权 访 问 获 取 支 付 账户 的 个 人 信息 利用 价值 非常 大 ， 往 往 也 会 被 欺诈 者 在 黑 产 
市 场 中 反复 交易 利用 。 

对 于 账户 撞 库 风险 ， 更 是 第 三 方 支付 平台 乃至 所 有 互联 网 企业 头疼 的 一 个 难题 。 由 于 
互联 网 时 期 是 信息 爆炸 的 时 代 ， 许 多 用 户 会 在 网 络 上 注册 开通 许 许多 多 的 应 用 或 网 站 服 
务 。 许 多 人 为 了 方便 ， 会 在 不 同 的 网 站 和 应 用 中 注册 同一 个 账号 密码 ， 这 就 给 客户 的 信息 
安全 及 财产 安全 带 来 了 不 安全 因素 。 只 要 其 中 某 一 个 应 用 或 网 站 的 安全 性 较 弱 导致 被 黑客 
攻陷 ， 那 么 该 网 站 的 账号 密码 数据 库 就 会 发 生 泄露 ， 这 个 过 程 称 为 “ 拖 库 ”。 黑 客 在 完成 
“ 拖 库 ”之 后 ， 会 对 数据 进行 清洗 、 封 装 ， 并 对 一 些 有 价值 的 平台 进行 定向 撞 库 攻击 ， 即 
用 已 泄露 的 账号 密码 进行 模拟 登录 尝试 ， 若 尝试 成 功 即 意味 着 单个 账户 撞 库 成 功 。 账 户 撞 
库 风险 的 危害 在 于 导致 数据 大 规模 泄露 ， 同 时 黑客 攻击 的 成 本 正 随 着 工具 自动 化 而 逐步 
降低 。 


对 这 种 登录 场景 中 出 现 的 欺诈 风险 ， 可 以 利用 大 数据 技术 采取 以 下 几 种 风险 防范 


普 施 。 

(1) 判断 用 户 的 登录 行为 异常 。 一 般 情况 下 ， 用 户 在 短 时 间 内 通常 只 会 在 同一 个 人 地 
址 进行 连续 登录 ， 而 短 时 间 内 在 不 同 的 了 P 地 址 登录 的 概率 很 低 。 当 出 现 用 户 在 极 短 时 间 内 
连续 登录 且 每 次 登录 的 IP 解析 位 置 距 离 偏 移 过 大 时 ， 这 很 可 能 是 欺诈 者 在 挂 IP 代理 进行 
登录 ， 意 图 隐匿 登录 来 源 。 为 此 ， 第 三 方 支付 平台 可 以 运用 规则 模型 对 登录 用 户 的 登录 时 
间 间 隔 和 人 P 解析 地 址 偏 移 进行 测算 ， 当 检测 到 上 述 异 常 行为 时 ， 那 么 系统 可 以 对 此 用 户 加 
大 关注 度 。 

(2) 判断 用 户 登录 环境 异常 。 在 撞 库 过 程 中 ， 黑 客 往往 会 使 用 成 熟 的 工具 程序 进行 批 
量 模拟 登录 接口 。 那 么 ， 我 们 可 以 在 登录 页 面 布控 人 机 识别 检测 程序 ， 判 断 登 录 来 源 设备 
是 否 缺 失 、 伪 造 ， 用 户 交 互 的 行为 是 否 存 在 缺陷 。 

(3) 判断 用 户 登录 习惯 异常 。 一 般 情况 下 ， 第 三 方 支付 平台 用 户 的 账户 常用 设备 、 常 
用 登录 地 都 是 稳定 的 ， 而 出 现 登录 习惯 异常 时 ， 很 有 可 能 是 出 现 了 账户 被 盗用 的 情况 。 对 
此 ， 第 三 方 支付 平台 可 以 运用 大 数据 技术 ， 对 用 户 登录 行为 进行 长 时 间 的 跟踪 分 析 ， 分 析 
出 账户 常用 设备 、 常 用 登录 地 等 行为 习惯 。 在 此 数据 分 析 基 础 上 ， 建 立 一 套 可 信 设 备 体 
系 ， 即 对 于 在 可 信 设 备 上 的 行为 业务 应 快速 通过 放行 ， 而 发 生 在 非 可 信 设 备 上 的 行为 应 加 
入 重点 关注 。 


3. 绑 卡 场景 


在 用 户 绑 卡 场景 中 ， 第 三 方 支付 平台 通常 已 经 从 卡 的 维度 进行 风险 防 控 ， 主 要 是 对 卡 
进行 卡号 、 身 份 证 、 姓 名 、 预 留 手机 四 要 素 进行 验证 。 然 而 这 种 风险 防 控 仍 然 存在 一 定 的 
漏洞 ， 并 不 能 完全 管控 欺诈 风险 。 

对 欺诈 者 而 言 ， 首 先 会 通过 制作 手机 木马 钓鱼 软件 进行 传播 ， 主 要 以 手机 端 为 主要 的 
传播 渠道 。 一 旦 有 用 户 的 手机 不 幸 中 招 ， 那 么 该 手机 接收 的 校 验 短信 码 会 被 木马 钓鱼 软件 
拦截 控制 。 欺 诈 者 通过 该 方式 能 够 收集 一 批 受 控制 的 手机 及 号 码 ， 随 后 从 黑市 交易 的 泄露 
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数据 中 进行 筛选 匹配 ， 找 出 匹配 的 泄露 的 银行 卡 、 姓 名 、 身 份 证 信息 。 欺 诈 者 可 以 利用 这 
些 信息 在 其 他 第 三 方 支付 平台 注册 新 账户 ， 并 以 客户 的 身份 完成 绑 卡 操作 ， 之 后 再 将 资金 
转 走 ， 也 可 以 用 此 修改 账户 的 密码 。 
面 对 绑 卡 场景 中 的 欺诈 风险 ， 可 以 利用 大 数据 技术 对 绑 卡 用 户 的 信息 、 设 备 、 卫 等 维 
度 进 行 关联 分 析 ， 对 于 中 介 或 者 团伙 的 批量 绑 卡 行为 特征 进行 快速 甄别 。 若 出 现 异 常 行为 
则 立即 进行 反馈 ， 如 冻结 账号 、 通 知 真 实用 户 等 。 

4. 支付 场景 


在 支付 场景 中 ， 主 要 面临 的 欺诈 风险 是 盗 卡 支付 及 监管 层面 要 求 的 反 洗钱 反 套 现 
监控 。 

盗 卡 支付 风险 还 是 源 于 个 人 隐私 信息 泄露 ， 用 户 在 绑 卡 的 时 候 ， 其 银行 卡 、 身 份 证 、 
手机 号 信息 很 有 可 能 被 黑客 获取 并 将 信息 打包 转卖 。 现 在 也 有 不 少 欺诈 者 通过 各 种 渠道 如 
邮件 或 伪 基 站 ， 发 送 钓鱼 链接 诱导 用 户主 动 送 上 自己 的 信息 。 被 盗 客户 账户 的 交易 行为 会 
出 现 异常 ， 例 如 原本 交易 量 较 小 的 账户 突然 发 生 连 续 的 多 笔 支付 操作 ， 或 者 银行 卡 出 现 莫 
名 的 支付 行为 。 而 洗钱 套现 行为 更 多 是 金融 账户 持 有 人 的 违规 行为 ， 通 过 利用 系统 的 漏洞 
来 达到 经 济 上 的 收益 。 

对 于 支付 场景 中 的 风险 ， 第 三 方 支付 平台 可 以 通过 对 一 周 或 者 一 个 月 内 的 账户 资金 流 
入 流出 进行 分 析 ， 如 果 资 金 的 流动 密集 集中 在 一 些 账户 ， 而 这 些 账户 活跃 的 IP、 设 备 是 同 
一 个 或 者 相近 的 ， 那 么 风险 异常 的 概率 是 非常 高 的 ， 可 能 存在 着 盗 卡 支付 和 洗钱 套现 的 
行为 。 


(OI 大 数据 在 网 络 借贷 中 的 应 用 


6.2.1 推荐 系统 简 述 


推荐 系统 (Recommender System)， 是 指 建立 在 海量 数据 挖掘 基础 上 的 一 种 高 级 商务 智 
能 系统 ， 它 是 一 种 把 用 户 提供 的 推荐 信息 作为 输入 ， 然 后 将 这 些 信 息 进 行 聚合 、 处 理 ， 最 
后 把 相关 信息 投放 给 合适 的 客户 的 信息 服务 。 形 象 地 讲 ， 推 荐 系统 就 是 用 来 在 用 户 的 兴趣 
与 被 推荐 物品 之 间 所 搭 起 来 的 一 座 桥梁 。 例 如 ， 当 客户 在 选 淘宝 时 ， 发 现 淘宝 的 主 界面 会 
出 现 用 户 购买 过 、 收 藏 过 、 浏 览 过 的 商品 或 相关 商品 。 这 种 对 用 户 的 商品 推荐 就 是 由 推荐 
系统 运作 形成 的 。 

推荐 系统 主要 包括 3 个 部 分 : 输入 模块 、 推 荐 引擎 模块 、 输 出 模块 。 


1. 输入 模块 


输入 模块 又 被 称 为 用 户 模块 ， 这 里 的 用 户 指 的 是 信贷 产品 的 购买 者 和 潜在 购买 者 。 在 
系统 中 ， 输 入 模块 的 主要 作用 是 负责 收集 和 更 新 用 户 的 信息 。 具 体 而 言 又 包括 两 大 部 分 ， 
一 部 分 是 用 户 的 基本 特征 信息 ， 包 括 年 龄 、 性 别 、 职 业 、 收 入 等 ， 另 一 部 分 是 用 户 的 行为 
信息 ， 包 括 显 性 信息 (如 评分 、 评 论 等 ) 和 隐 性 信息 (用 户 浏览 网 页 的 停留 时 间 、 点 击 率 、 客 
户 转化 率 等 )。 
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2. 推荐 引擎 模块 


推荐 引擎 模块 又 称 客户 推荐 算法 模块 ， 它 是 整个 推荐 系统 的 核心 部 分 。 该 模块 通过 算 
法 对 输入 模块 所 采集 的 数据 进行 分 析 处 理 ， 之 后 再 将 结果 输出 。 推 荐 算法 的 好 坏 直 接 影响 
到 整个 系统 的 效率 和 效果 。 常 见 的 推荐 算法 主要 有 协同 过 滤 推 荐 、 基 于 内 容 的 推荐 、 基 于 
知识 的 推荐 等 。 

(1) 协同 过 滤 推 荐 (Collaborative Filtering Recommendation)。 是 推荐 系统 中 应 用 最 早 和 
最 为 成 功 的 技术 之 一 。 它 一 般 采 用 最 近邻 技术 ， 利 用 用 户 的 历史 喜好 信息 计算 用 户 之 间 的 
距离 ， 然 后 利用 目标 用 户 的 最 近邻 居 用 户 对 商品 评价 的 加 权 评 价值 来 预测 目标 用 户 对 特定 
商品 的 喜好 程度 ， 系 统 从 而 根据 这 一 喜好 程度 来 对 目标 用 户 进行 推荐 。 协 同 过 滤 的 最 大 优 
点 是 对 推荐 对 象 没 有 特殊 的 要 求 ， 能 处 理 非 结构 化 的 复杂 对 象 ， 如 音乐 、 电 影 。 

(2) 基于 内 容 的 推荐 (Content-based Recommendation)。 是 信息 过 滤 技 术 的 延续 与 发 
展 ， 它 是 建立 在 项 目的 内 容 信息 上 做 出 推荐 的 ， 而 不 需要 依据 用 户 对 项 目的 评价 意见 ， 更 
多 地 需要 用 机 器 学 习 的 方法 从 关于 内 容 的 特征 描述 的 事例 中 得 到 用 户 的 兴趣 资料 。 在 基于 
内 容 的 推荐 系统 中 ， 项 目 或 对 象 通过 相关 的 特征 的 属性 来 定义 ， 系 统 基于 用 户 评价 对 象 的 
特征 ， 学 习 用 户 的 兴趣 ， 考 察 用 户 资料 与 待 预测 项 目的 相 匹配 程度 。 用 户 的 资料 模型 取决 
于 所 用 的 学 习 方法 ， 常 用 的 有 决策 树 、 神 经 网 络 和 基于 向 量 的 表示 方法 等 。 基 于 内 容 的 用 
户 资料 需要 有 用 户 的 历史 数据 ， 用 户 资料 模型 可 能 随 着 用 户 的 偏好 改变 而 发 生变 化 。 

(3) 基于 知识 的 推荐 Knowledge-based Recommendation)。 在 某 种 程度 是 可 以 看 作 一 种 
推理 技术 ， 它 不 是 建立 在 用 户 需 要 和 偏好 基础 上 推荐 的 。 基 于 知识 的 方法 因 它们 所 用 的 功 
能 知识 不 同 而 有 明显 区 别 。 效 用 知识 是 一 种 关于 一 个 项 目 如 何 满足 某 一 特定 用 户 的 知识 ， 
因此 能 解释 需要 和 推荐 的 关系 ， 所 以 用 户 资料 可 以 是 任何 能 支持 推理 的 知识 结构 ， 它 可 以 
是 用 户 已 经 规范 化 的 查询 ， 也 可 以 是 一 个 更 详细 的 用 户 需 要 的 表示 。 


3. 输出 模块 


输出 模块 是 一 个 将 推荐 结果 展现 给 客户 的 一 个 模块 ， 它 包含 多 种 形式 ， 例 如 建议 、 预 
测 、 个 体 以 及 评分 等 等 。 例 如 互联 网 用 户 在 “淘宝 ”主页 上 发 现 自己 喜欢 的 商品 以 及 浏览 
过 的 商品 ， 这 就 是 一 种 界面 化 的 建议 。 


6.2.2 ”P2P 网 站 中 的 个 性 化 推荐 


个 性 化 推荐 是 指 根据 用 户 的 兴趣 特点 和 购买 行为 ， 向 用 户 推荐 其 可 能 感 兴趣 的 信息 和 
商品 。 在 P2P 网 站 中 ， 随 着 信贷 规模 的 不 断 扩 大 ， 信 贷 产 品 个 数 和 种 类 快速 增长 ， 贷 款 者 
往往 需要 耗费 大 量 的 时 间 和 精力 才能 找到 合适 的 信贷 产品 。 而 浏览 大 量 无 关 的 信息 和 产品 
无 疑 会 降低 用 户 的 使 用 体验 ， 使 淹没 在 信息 过 载 问题 中 的 消费 者 不 断 流失 。 

为 了 解决 P2P 网 站 中 的 这 一 问题 ， 个 性 化 推荐 系统 是 一 个 可 行 的 解决 思路 。 在 海量 数 
据 挖掘 基础 上 ， 构 建 一 个 基于 个 性 化 推荐 系统 的 高 级 商务 智能 平台 ， 可 以 通过 电子 商务 网 
站 为 其 客户 购物 提供 个 性 化 的 决策 支持 和 信息 服务 。 一 般 P2P 网 站 有 大 量 的 信贷 产品 ， 用 
户 常常 感到 难以 入 手 ， 如 果 有 一 种 信贷 产品 选 购 的 助手 ， 能 根据 客户 的 兴趣 爱好 推荐 其 可 
能 感 兴趣 的 信贷 产品 ， 可 以 有 效 提高 客户 的 满意 度 。 
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在 P2P 网 站 中 使 用 个 性 化 推荐 的 最 大 的 优点 在 于 : 一 方面 可 以 获取 信贷 产品 的 特点 ， 
如 贷款 人 的 特征 和 借款 记录 ， 信 贷 产品 的 期 限 、 风 险 和 收益 度 ; 另 一 方面 又 可 以 获取 用 户 
的 特点 ， 如 客户 的 产品 浏览 记录 、 个 性 化 需求 和 兴趣 偏好 、 客 户 的 个 人 属性 、 客 户 过 去 的 
贷款 行为 和 贷款 记录 等 ， 从 而 为 贷款 客户 做 出 个 性 化 推荐 。 此 外 ， 系 统 给 出 的 推荐 是 可 以 
实时 更 新 的 ， 即 当 系 统 中 的 信贷 产品 库 或 用 户 特 征 库 发 生 改变 时 ， 给 出 的 推荐 序列 会 自动 
改变 ， 这 就 大 大 提高 了 P2P 贷款 的 简便 性 和 有 效 性 ， 同 时 也 提高 了 P2P 平台 的 服务 水 平 。 

总 体 来 说 ， 一 个 成 功 的 P2P 网 站 个 性 化 推荐 系统 的 作用 主要 体现 在 以 下 3 个 方面 。 

(1) 将 P2P 平台 的 浏览 者 转化 为 使 用 者 。 一 般 地 ，P2P 平台 的 浏览 者 在 浏览 过 程 中 并 
没有 投资 或 贷款 的 欲望 ， 而 个 性 化 推荐 系统 能 够 推荐 他 们 感 兴趣 的 信贷 产品 ， 从 而 形成 有 
效 的 客户 转化 。 

(2) 提高 P2P 平台 的 交叉 销售 能 力 。 个 性 化 推荐 系统 在 贷款 客户 的 选择 过 程 中 向 用 户 
推荐 其 他 有 价值 的 信贷 产品 ， 用 户 能 够 从 系统 提供 的 推荐 列表 中 找到 自己 确实 需要 但 在 购 
买 过 程 中 没有 想到 的 信贷 产品 ， 从 而 有 效 提高 P2P 平台 的 交叉 销售 。 

(3) 提高 客户 对 P2P 平台 的 忠诚 度 。 与 传统 的 贷款 模式 相 比 ，P2P 平台 使 得 用 户 拥有 
越 来 越 多 的 选择 ， 用 户 更 换 信贷 产品 极其 方便 ， 只 需要 点 击 一 两 次 鼠标 就 可 以 在 不 同 的 
P2P 平台 之 间 跳 转 。 个 性 化 推荐 系统 可 以 分 析 客户 的 贷款 习惯 ， 根 据 客户 需求 向 用 户 提供 
有 价值 的 信贷 产品 。 高 质量 的 推荐 系统 可 以 使 用 户 产生 依赖 。 因 此 ， 个 性 化 推荐 系统 不 仅 
能 够 为 用 户 提供 个 性 化 的 推荐 服务 ， 而 且 能 促进 P2P 平台 与 用 户 建立 长 期 稳定 的 关系 ， 提 
高 客户 忠诚 度 ， 防 止 客户 流失 。 

个 性 化 推荐 系统 具有 良好 的 发 展 和 应 用 前 景 。 目 前 ， 许 多 P2P 网 站 都 不 同 程度 地 使 用 
了 各 种 形式 的 推荐 系统 。 在 大 数据 环境 下 ， 个 性 化 推荐 系统 能 够 有 效 地 保留 客户 ， 提 高 
P2P 网 站 的 服务 能 力 ， 为 其 带 来 巨大 的 经 济 效益 。 


6.2.3 基于 VITA 系统 的 信贷 产品 匹配 机 制 


VITA 金融 服务 推荐 系统 是 为 匈牙利 Fundamental 信贷 协会 开发 的 一 种 基于 知识 的 推荐 
技术 。VITA 能 够 帮助 销售 代表 与 客户 在 销售 过 程 中 进行 交互 ， 可 以 提高 销售 代表 的 工作 
业绩 ， 降 低 开发 和 维护 相关 软件 的 整体 费用 ， 通 过 该 工具 ， 可 以 构建 一 个 基于 知识 的 推荐 
技术 。 其 知识 获取 平台 可 以 通过 图 形 用 户 界面 开发 推荐 系统 知识 库 和 推荐 过 程 定义 功能 。 

这 种 知识 获取 平台 也 适用 于 P2P 平台 。 目 前 P2P 遇 到 的 最 大 挑战 就 是 金融 行业 信贷 产 
品 的 增多 与 难以 满足 的 客户 的 个 性 化 借贷 需求 。 一 方面 ， 客 户 面临 如 此 众多 的 信贷 产品 无 
所 适 从 ， 另 一 方面 ，P2P 的 工作 人 员 也 很 难为 每 一 个 客户 选择 他 们 最 适合 的 信贷 产品 ， 也 
很 难 解释 将 这 些 产品 推荐 给 用 户 的 原因 。 因 此 ， 推 荐 系统 的 供应 商 的 主要 目标 是 提高 推荐 
的 整体 工作 效率 。 这 就 需要 提高 算法 的 准确 度 ， 同 时 还 要 提高 客户 的 黏度 ， 让 客户 有 兴趣 
使 用 某 个 P2P 平台 ， 这 就 需要 工作 人 员 能 够 处 理 极为 复杂 且 频 繁 变化 的 推荐 知识 库 。 基 于 
知识 的 推荐 技术 能 够 改善 这 种 情况 ， 因 为 它 能 高 效 地 挖掘 并 维护 知识 库 。 

将 VITA 系统 用 于 P2P 的 产品 推荐 ， 其 目标 主要 有 以 下 两 点 。 

(1) 提高 贷款 成 交 数 。 在 相同 的 时 间 内 ， 提 高 成 功 融资 产品 的 数量 。 

(2) 有 效 的 软件 开发 和 维护 。 新 技术 应 该 能 改善 配置 知识 库 的 开发 工作 。 
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而 最 终 的 VITA 支持 平台 可 自动 实现 对 大 量 历史 交易 数据 的 学 习 ， 并 实时 更 新 配置 知 
识 库 ， 并 将 新 知识 应 用 于 信贷 产品 和 客户 投资 需求 的 映射 。 更 新 知识 库 时 ， 知 识 获 取 平 台 
可 以 自动 测试 并 调试 知识 库 。 该 知识 库 包 括 以 下 元 素 。 

(1) 用 户 属性 。 每 个 用 户 必 须 表明 自己 的 需求 ， 这 是 合理 推荐 的 前 提 条 件 。 在 P2P 服 
务 领 域 ， 用 户 属 性 的 例子 有 年 龄 、 风 险 承受 能 力 、 预 期 的 放贷 有 效 期 、 现 有 贷款 组 合 等 。 

(2) 产品 属性 及 实例 。 每 个 信贷 产品 都 用 事先 定义 好 的 一 组 属性 词 描述 ， 比 如 ， 不 应 
该 向 没有 准备 好 承担 风险 的 用 户 推荐 高 风险 的 产品 。 

(3) 约束 。 确 定 某 些 场景 下 不 应 该 向 客户 推荐 某 些 信贷 产品 。 例 如 ， 不 应 该 向 风险 承 
受 能 力 差 得 用 户 推荐 风险 高 的 产品 。 

(4) 咨询 过 程 定义 。 对 信贷 产品 推荐 规则 进行 明确 的 定义 ， 构 建 状态 图 ( 见 图 6.1) 并 以 
此 确定 客户 提出 问题 的 场景 。 图 中 方 框 内 容 表示 推荐 规则 的 流程 ， 圆 圈 内 容 表示 客户 在 每 
个 阶段 可 能 提出 的 问题 。 

正如 图 6.1 所 示 ， 信 贷 推荐 过 程 包括 4 个 阶段 : 提取 需求 、 信 用 价值 审核 、 产 品 咨询 
和 选择 、 精 确 计算 及 展现 结果 。 在 第 一 阶段 ， 系 统 提取 客户 的 基本 信息 、 信 贷 的 目的 和 需 
求 。 提 取 之 后 再 审核 客户 的 信用 价值 ， 根 据 当 前 客户 的 金融 状况 、 历 史 借贷 记录 、 人 金融 有 
价 证 券 、 财 务 状 况 等 详细 信息 进行 评估 。 这 时 ， 系 统 应 检查 能 否 找到 满足 当前 需求 的 解决 
方案 。 如 果 没 有 ， 那 么 系统 户 设法 找到 其 他 符合 客户 需求 的 方案 。 在 信用 价值 审核 之 后 ， 
推荐 系统 可 能 会 推荐 多 种 符合 客户 要 求 的 信贷 产品 。 当 客户 选择 其 中 一 个 产品 时 ， 推 荐 系 
统 会 计算 并 提供 详细 的 信贷 产品 的 属性 ， 包 括 月 度 偿还 率 、 偿 还 期 限 、 保 留 条 款 等 。 


精确 计算 及 展现 结果 


图 6.1 咨询 过 程 定义 示例 


完成 信贷 产品 与 客户 的 匹配 ， 客 户 也 选择 了 该 信贷 产品 之 后 ，P2P 平台 就 可 以 开始 向 
客户 放贷 了 。 在 放贷 过 程 中 ， 用 户 随时 可 以 对 信贷 产品 进行 评价 ， 包 括 还 款 准时 率 、 收 益 
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率 、 客 户 满意 度 等 。 推 荐 系统 可 以 收集 这 些 信 息 ， 通 过 机 器 学 习 的 方法 获取 其 中 的 知识 ， 
然后 自动 更 新 已 有 的 知识 库 ， 以 准确 地 实现 产品 推荐 。 


(QU 下 大 数据 在 互联 网 供应 链 金融 中 的 应 用 


在 供应 链 金融 服务 中 ， 供 应 链 融 资 (Supply Chain Financing) 是 最 为 核心 的 业务 。 究 其 定 
义 ， 供 应 链 金融 是 指 把 供应 链 上 的 核心 企业 及 其 相关 的 上 下 游 配套 企业 作为 一 个 整体 ， 根 
据 供应 链 中 企业 的 交易 关系 和 行业 特点 制定 基于 货 权 及 现金 流 控制 的 整体 金融 解决 方案 的 
一 种 融资 模式 。 供 应 链 融资 是 对 银行 传统 信贷 模式 的 全 面 改革 ， 是 对 贸易 融资 、 企 业 理 
财 、 现 金管 理 等 一 系列 金融 产品 的 整合 。 

根据 资金 来 源 的 不 同 ， 供 应 链 融 资 可 以 分 成 内 部 融资 和 外 部 融资 两 种 。Q@ 供 应 链 内 部 
融资 ， 是 指 利用 上 下 游 企业 提供 的 商业 信用 来 加 速 资金 周转 ， 提 高 资金 利用 率 ，@ 供 应 链 
外 部 融资 ， 是 指 利 用 银行 等 金融 中 介 机 构 提 供 的 流动 资金 贷款 来 缓解 资金 约束 。 然 而 ， 在 
供应 链 中 资金 充裕 的 核心 企业 ， 出 于 自身 利益 最 大 化 和 保持 现金 流 稳定 的 角度 考虑 ， 并 不 
主动 愿意 为 中 小 企业 提供 融资 ， 因 此 需要 外 部 金融 机 构 的 介入 。 

供应 链 融资 解决 了 上 下 游 企 业 融资 难 、 担 保 难 的 问题 ， 而 且 通过 打通 上 下 游 融资 瓶 
颈 ， 还 可 以 降低 供应 链条 融资 成 本 ， 提 高 核心 企业 及 配套 企业 的 竞争 。 

互联 网 供应 链 融 资 (Supply Chain Financing-online) 是 指 利 用 互联 网 技术 ， 对 供应 链 中 的 
核心 企业 提供 融资 ， 并 通过 大 数据 、 云 计算 控制 风险 的 金融 业务 。 它 是 一 种 集成 的 概念 ， 
兼 有 互联 网 金融 和 供应 链 融资 的 一 般 性 质 ， 例 如 互联 网 金融 的 便利 性 、 虚 拟 性 、 创 新 性 以 
及 供应 链 融 资 的 流程 控制 、 成 本 控制 、 严 格 的 风险 管理 等 。 

根据 经 营 主体 的 不 同 ， 互 联网 供应 链 融 资 大 致 可 以 分 为 3 类 。 

(1) 合作 模式 的 互联 网 供应 链 融 资 。 商 业 银行 与 互联 网 电 商 通过 合作 协议 的 形式 ， 利 
用 商业 银行 的 资金 优势 及 互联 网 电 商 的 电子 商务 诚信 体系 ， 融 合资 金 流 、 信 息 流 和 物流 ， 
向 在 B2B 和 B2C 电子 商务 平台 从 事 交易 行为 的 小 微 企 业 提供 信用 贷款 等 信贷 类 产品 及 现 
金管 理 、 支 付 结算 等 金融 服务 。 例 如 ， 中 国 工 商 银行 (2007 年 )、 中 国 建设 银行 (2008 年 ) 先 
后 与 阿里 巴巴 合作 推出 的 电子 商务 平台 小 微 企业 无 抵押 贷款 即 属 于 此 种 类 型 。 这 是 最 早产 
生 的 互联 网 供应 链 融 资 模式 ， 亦 是 带 有 过 渡 性 质 的 模式 。 随 着 下 面 两 类 模式 的 出 现 ， 该 类 
模式 逐渐 消失 ， 因 而 不 能 代表 互联 网 供应 链 融 资 的 未 来 发 展 方向 。 

(2) 电 商 主导 的 互联 网 供应 链 融 资 。 互 联网 电 商 利用 其 自身 的 注册 资本 及 电子 商务 诚 
信 体 系 向 其 B2B 和 B2C 电子 商务 平台 的 小 微 企业 提供 信用 贷款 。 例 如 ，2010 年 6 月 成 立 
的 “阿里 小 贷 公 司 ” 即 是 首 家 全 国 范围 内 的 小 额 贷款 公司 。 

(3) 商业 银行 主导 的 互联 网 供应 链 融 资 。 商 业 银行 自主 建立 B2B 和 B2C 电子 商务 平 
台 ， 同 时 兼 具 了 电 商 和 资金 提供 者 的 身份 。 一 方面 ， 为 中 小 企业 或 小 微 企业 提供 交易 信息 
发 布 、 在 线 交 易 的 电子 商务 平台 渠道 ; 另 一 方面 ， 在 全 方位 掌握 在 线 企业 交易 信用 数据 的 
基础 上 ， 建 立 电子 商务 诚信 体系 ， 向 企业 提供 支付 结算 、 融 资 贷款 、 资 金 托 管 等 全 方位 的 
专业 服务 。 例 如 ， 建 设 银行 的 “ 善 融 商务 企业 /个 人 商城 ”(2012 年 ) 和 工商 银行 的 “ 融 e 购 
企业 商城 /个 人 ”(2014 年 ) 均 是 商业 银行 自主 建立 的 B2B 和 B2C 电子 商务 平台 ， 直 接 为 平 
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台 上 的 企业 提供 供应 链 融 资 服务 。 


6.3.1 基于 大 数据 的 互联 网 企业 信用 评估 
1. 供应 链 中 的 企业 信用 问题 


中 小 型 企业 对 我 国 的 经 济 发 展 起 着 重要 的 作用 ， 它 创造 了 将 近 60% 的 GDP， 解 决 了 全 
国 80% 的 就 业 。 但 由 于 我 国 的 金融 市 场 的 不 完善 ， 中 小 企业 的 融资 渠道 和 手段 有 限 ， 主 要 
还 是 靠 自 有 资金 和 信贷 资金 维持 生产 经 营 。 而 仅 靠 自 有 资金 难以 支撑 企业 的 发 展 ， 因 此 信 
贷 资 金成 为 中 小 企业 扩大 再 生产 的 一 种 手段 。 但 是 由 于 企业 估 值 不 合理 、 财 务 报表 披露 不 
到 位 、 信 用 观念 薄弱 等 因素 ， 银 行 出 于 风险 考虑 并 不 愿意 向 中 小 企业 提供 贷款 ， 因 此 ， 融 
资 难 一 直 是 中 小 企业 发 展 过 程 中 的 难题 。 

而 供应 链 融 资 是 缓解 中 小 企业 融资 难 的 有 效 途径 。 在 供应 链 融 资中 ， 正 确 评估 企业 的 
资信 是 控制 供应 链 融资 风险 的 核心 内 容 ， 即 提高 金融 机 构 对 中 小 企业 信用 风险 评估 的 准确 
性 ， 使 优良 的 中 小 企业 及 时 得 到 贷款 ， 同 时 降低 金融 机 构 所 面临 的 信用 风险 。 


2. 基于 人 工 智能 的 信用 评分 模型 


金融 机 构 为 了 降低 互联 网 供应 链 金融 业务 中 的 信用 风险 ， 常 会 借助 统计 学 的 方法 确定 
借款 者 的 信用 度 ， 并 通过 科学 的 算法 建立 信用 评分 模型 ， 从 而 将 企业 的 信用 状况 量化 成 为 
信用 评分 。 

信用 评分 模型 已 经 被 金融 机 构 普 遍 采 用 。 人 金融 机 构 通过 信用 评分 模型 降低 贷款 程序 中 
的 开销 ， 减 少 不 良 贷款 带 来 的 损失 ， 从 而 为 有 效 的 决策 提供 强 有 力 的 支持 。 

信用 评分 的 发 展 大 致 经 历 了 专家 分 析 、 统 计 分 析 和 人 工 智 能 3 个 阶段 。1970 年 以 后 ， 
信用 评分 主要 采用 定性 的 方法 ， 主 要 的 分 析 方法 有 SC 分 析 法 、 五 级 分 类 分 析 法 。 大 多 数 
金融 机 构 基本 上 是 靠 专 家 的 分 析 来 评估 信用 风险 。 但 是 ， 随 着 业务 量 的 增 大 ， 人 工 完成 这 
项 工作 是 不 可 能 的 。 因 此 ， 信 用 产业 的 许多 机 构 纷 纷 开 发 新 的 模型 来 支持 信用 决策 。 这 些 
模型 则 在 提高 衡量 信用 程度 的 准确 率 ， 从 而 降低 信用 风险 、 减 少 损失 。1970 一 1990 年 ， 金 
融 机 构 主 要 采用 的 是 基于 财务 指标 的 信用 评分 模型 。 第 一 个 信用 评分 模型 由 Altman 提 
出 。 现 代 的 信用 评估 模型 可 以 分 为 两 种 : 统计 模型 和 人 工 智 能 模型 。 最 常见 的 统计 模型 为 
线性 判别 分 析 (LDA) 和 Logistic 回归 (LR)。 由 于 变量 之 间 的 线性 关系 不 足 ， 因 此 这 两 个 模 
型 的 准确 度 不 高 。 而 随 着 信息 技术 的 发 展 ， 一 些 人 工 智能 的 方法 已 经 被 用 来 建立 准确 且 稳 
定 的 信用 风险 评估 系统 。 例 如 ， 人 工 神经 网 络 (ANNs)、 决 策 树 (DT)、 贝 叶 斯 分 类 器 (BC)、 
模糊 规则 系统 以 及 集成 学 习 模型 等 ， 在 信用 风险 评估 中 取得 了 和 良好 的 效果 。 与 统计 模型 不 
同 的 是 ， 人 工 智 能 可 以 直接 从 数据 中 集中 获取 训练 知识 ， 并 不 需要 关于 变量 分 布 的 假设 。 
因此 ， 人 工 智能 模型 的 性 能 更 好 。 

3. 基于 PSO-BP 集成 的 企业 信用 分 

关于 大 数据 对 企业 信用 的 评估 ， 下 面 简单 介绍 较为 典型 的 PSO-BP 集成 的 企业 信用 评 
分 模型 。 该 模型 的 流程 有 以 下 几 个 步 又 。 

第 一 步 ， 使 用 bagging 抽样 技术 获得 足够 多 不 同 的 训练 数据 集 。 
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第 二 步 ， 构 建 PSO-BP 组 合成 员 分 类 器 ， 然 后 使 用 不 同 的 训练 数据 集训 练 此 分 类 器 。 

第 三 步 ， 使 用 组 合 投票 准则 整合 不 同 组 合成 员 分 类 器 的 分 类 结果 ， 得 到 企业 的 信 
用 分 。 

第 四 步 ， 在 测试 数据 集 上 测试 模型 的 性 能 。 

该 模型 的 整体 架构 如 图 6.2 所 示 。 


PSO-BPm 


图 6.2 PSO-BP 集成 模型 整体 架构 


1) ”产生 训练 集 子 集 

现实 中 ， 当 需要 对 一 个 重要 问题 做 决策 时 ， 往 往 需要 综合 多 个 专家 的 意见 。 在 机 器 学 
习 中 也 一 样 ， 常 常 需要 构建 多 个 计算 模型 ， 然 后 综合 所 有 模型 的 运算 结果 得 出 结论 。 
Bagging 算法 是 机 器 学 习 领 域 中 广泛 使 用 的 数据 抽样 算法 ， 常 被 用 来 从 原始 数据 集中 创建 
不 同 的 样本 ， 用 以 得 到 不 同 的 分 类 计算 模型 。 它 作为 机 器 学 习 领 域 极 为 有 效 的 数据 处 理 模 
型 ， 采 用 随机 放 回 抽样 的 方式 ， 可 以 得 到 一 定数 量 的 训练 数据 集 。 

2) ”创建 不 同 的 分 类 器 

组 合 模型 能 取得 更 高 分 类 准确 率 的 一 个 充分 必要 条 件 为 ， 用 于 组 合 的 分 类 器 必须 是 准 
确 和 有 差异 的 。 一 般 地 ， 组 合成 员 差 异 度 较 大 的 组 合 模型 具有 更 高 的 泛 化 能 力 。 因 此 ， 如 
何 生 成 差异 度 最 大 的 分 类 器 成 为 一 个 关键 的 问题 。 对 神经 网 络 模型 来 说 ， 为 生成 不 同 的 分 
类 器 模型 ， 可 以 通过 参数 变化 、 网 络 结构 设计 的 变化 或 是 神经 网 络 训练 方式 的 变化 等 方法 
实现 。 

3) ”训练 PSO-BP 模型 

由 于 PSO-BP 模型 具有 泛 化 能 力 和 收敛 速度 上 的 优势 ， 所 以 选用 该 模型 。PSO-BP 模 
型 是 PSO 与 BP 神经 网 络 的 混合 优化 算法 。 该 混合 算法 的 根本 出 发 点 在 于 ， 在 初始 阶段 使 
用 APSO 进行 全 局 搜索 ， 然 后 使 用 BP 在 全 局 最 优 位 置 附近 进行 局 部 搜索 ， 从 而 提高 收敛 
速度 。 在 PSO-BP 的 使 用 过 程 中 ， 考 虑 到 PSO 的 迭代 次 数 较 少 (5 次 )， 采 用 惯性 权重 随 着 
算法 迭代 自动 变化 的 APSO 算法 意义 不 大 ， 因 此 选择 了 带 压缩 的 粒子 群 算法 进行 迭代 寻 
优 。PSO-BP 算法 的 流程 如 图 6.3 所 示 。 

(1) 在 [0，1] 范 围 内 随机 初始 化 粒子 群体 的 位 置 和 速度 。 
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(2) 计算 每 个 粒子 的 适应 值 ， 初 始 为 当前 粒子 的 局 部 位 置 ， 设 置 为 初始 种 群 的 全 局 最 
优 位 置 。 

(3) 如 果 进 入 最 大 的 迭代 次 数 ， 算 法 转 到 (7)， 否 则 继续 运行 (4)。 

(4) 存储 当前 种 群 的 最 优 粒子 ， 并 更 新 粒子 的 速度 和 位 置 ， 这 样 就 形成 了 一 组 新 的 种 
群 ， 如 果 新 的 粒子 位 置 超出 了 界限 [,,。， 际 ,。]， 新 的 位 置 将 会 被 设置 为 ,或 了 。; 如 
果 新 的 粒子 速度 超出 了 界限 [及 ,及 ]， 新 的 速度 将 会 设置 为 及. 或 及 。 

(5) 计算 每 个 粒子 的 适应 值 ， 最 差 的 粒子 由 最 好 的 粒子 代替 。 如 果 粒 子 i 的 新 位 置 比 
Po 更 好 ， 该 位 置 将 作为 第 i 个 粒子 新 的 Pb。 如 果 所 有 粒子 中 存在 比 Ps 更 优 的 粒子 ，Pe 将 
得 到 更 新 。 

(6) 使 用 BP 算法 在 Ps 附近 搜索 ， 如 果 搜 索 结果 由 于 Pe， 将 P 作为 当前 搜索 结果 。 
另外 ， 在 搜索 过 程 中 ， 如 果 测 试 数据 集 上 Ps 超过 一 定 的 迭代 次 数 没有 变化 ，BP 算法 搜 

(7) 输出 全 局 最 优 的 Ps。 

4) “分 类 结果 集成 

基于 上 述 几 个 步骤 的 工作 。 可 以 得 到 一 组 不 同 的 PSO-BP 组 合 分 类 成 员 。 之 后 就 是 通 
过 一 个 适当 的 组 合 策略 将 不 同 的 分 类 器 集成 为 一 个 分 类 器 ， 常 见 的 组 合 策略 包括 多 数 投票 
准则 、 排 序 准则 和 权 值 平均 等 。 最 常用 的 就 是 多 数 投票 准则 ， 在 该 策略 中 ， 组 合成 员 分 类 
器 的 成 员 决定 了 最 终 的 输出 。 

总 之 ， 基 于 PSO-BP 集成 的 信用 评估 模型 ( 见 图 6.3)， 与 其 他 的 信用 评估 模型 相 比 准确 
率 更 高 。 


初始 化 粒子 群 


初始 化 局 部 /全 局 最 优 位 置 


更 新 粒子 的 局 部 最 优 位 置 
和 全 局 最 优 位 置 


使 用 BP 算法 在 全 局 最 优 
位 置 附近 搜索 


更 新 粒子 的 速度 
和 位 置 


图 6.3 PSO-BP 算法 的 流程 
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6.3.2 案例 : 京东 供应 链 金融 模式 


近年 来 ， 京 东 频 频 加 码 互联 网 金融 ， 供 应 链 金融 是 其 金融 业务 的 根基 。 京 东 通 过 差异 
化 定位 及 自 建物 流体 系 等 战略 ， 并 通过 多 年 积累 和 沉淀 ， 已 形成 一 套 以 大 数据 驱动 的 京东 
供应 链 体系 ， 为 上 游 供应 商 提供 贷款 和 理财 服务 ， 为 下 游 消费 者 提供 肉 销 和 分 期 付款 服 
务 。 具 体 可 以 分 为 采购 订单 融资 、 入 库 环节 入 库 单 融资 、 结 算 前 应 收 账 款 融资 、 担 保 、 保 
单 业务 扩大 融资 、 协 同 投资 信托 计划 、 资 产 包 转移 计划 、 消 费 者 分 期 付款 、 消 费 者 投资 理 
财 等 类 型 ， 涉 及 应 收 账 款 融资 、 订 单 融资 、 委 托 融 资 、 协 同 融资 、 信 托 计 划 、 京 东 和 白条、 
校园 和 白条、 保险、 理财、 黄金 等 产品 。 京 东 有 非常 优质 的 上 游 的 供应 商 、 下 游 的 个 人 消费 
者 、 精 准 的 大 数据 ， 京 东 的 供应 链 金融 业务 水 到 渠 成 。 京 东 商 城 的 CEO 刘强 东 也 表示 ， 
未 来 的 商业 竞争 是 供应 链 的 竞争 ， 而 供应 链 金 融 提 高 了 供应 链 整 体 的 运营 能 力 ， 通 过 资金 
流 带 动 整个 链条 不 断 向 前 滚动 ， 从 而 实现 供应 链 的 有 机 整合 。 京 东 供应 链 金融 模式 的 具体 
流程 如 图 6.4 所 示 。 


本 资产 包 转移 计划 
资 


图 6.4 京东 供应 链 金融 模式 的 流程 


京东 供应 链 金 融 有 个 很 有 时 代 意义 的 创新 产品 一 一 动产 融资 。 传 统 动产 融资 有 三 大 困 
局 : 一 是 抵 质 押 物 范围 小 ， 广 大 中 小 企业 的 动产 价值 难以 评估 并 用 来 质押 ， 二 是 缺乏 全 国 
性 的 、 电 子 化 的 动产 质押 登记 平台 ， 导 致 重复 质押 等 风险 事件 频 发 ， 三 是 质押 方式 死板 ， 
货物 一 旦 用 来 融资 ， 流 动 性 将 大 大 降低 ， 不 能 随 着 买 进 卖 出 自动 调整 融资 额度 。 以 上 问题 
导致 大 量 中 小 企业 不 能 被 纳入 动产 融资 服务 的 覆盖 范围 。 京 东 供应 链 金 融 设 计 了 一 款 可 以 
同时 解决 以 上 问题 的 底层 架构 ， 可 以 通过 数据 和 模型 化 的 方式 自动 评估 商品 价值 ， 他 们 与 
具有 “互联 网 +” 特 点 的 仓 配 企业 合作 ， 全 面 整 合 了 质押 商品 从 生产 、 运 输 、 存 储 到 销售 
的 全 链条 数据 交叉 验证 ， 实 现 动态 质押 。 这 款 产品 一 经 推出 ， 就 迅速 实现 单 月 放贷 破 亿 。 
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动产 融资 还 在 向 B2B 平台 采购 的 经 销 商 提供 服务 。 

基本 上 ， 京 东 供应 链 金融 的 创新 产品 已 经 在 为 各 类 场景 、 特 点 的 企业 服务 ， 覆 盖 了 很 
多 传统 融资 触 达 不 到 的 群体 。2015 年 年 底 ， 京 东 供应 链 金融 宣布 将 与 企业 理财 打通 ， 让 企 
业 缺 钱 时 借 钱 ， 有 钱 时 理财 。 作 为 一 家 仅仅 提供 供应 链 金融 3 年 多 的 企业 ， 京 东 供应 链 金 
融 的 创新 速度 和 展业 速度 令 人 吃惊 。 


(OD 到 大 数据 在 互联 网 消费 金融 中 的 应 用 


6.4.1 互联 网 消费 金融 的 大 数据 征 信和 与 风 控 


消费 金融 中 最 重要 的 一 个 问题 就 是 本 身 所 存在 的 信用 风险 。 由 于 消费 金融 的 主要 客户 
群体 是 年 轻 人 群 和 中 低 收入 人 群 ， 且 主要 是 以 个 人 的 信用 状况 为 担保 ， 没 有 抵押 物 ， 因 
此 ， 经 营 主体 出 于 风险 管理 角度 的 考虑 ， 对 客户 的 征 信 非常 重要 。 如 果 按 传统 的 方法 依靠 
线 下 收集 客户 信息 来 判断 其 还 款 能 力 和 还 款 意愿 ， 不 光 效 率 低下 无 法 获得 尽 可 能 多 的 客 
户 ， 还 无 法 对 客户 进行 有 效 的 信用 评估 。 

另外 ， 就 目前 我 国 实际 的 情况 而 言 ， 大 多 数 消费 金融 经 营 机 构 没 有 丰富 的 征 信 经 验 和 
征 信和 能力， 大 数据 征 信 产业 由 此 产生 。 许 多 消费 金融 公司 依托 大 数据 征 信 机 构 。 这 些 机 构 
利用 大 数据 的 方式 收集 客户 信息 ， 通 过 对 客户 群体 的 消费 数据 分 析 ， 进 行 客户 评级 ， 获 得 
有 效 的 风 控 模 型 ， 进 而 对 客户 进行 分 流 和 筛 查 ， 进 行 差异 化 管理 ， 并 不 断 优 化 风 控 模型 和 
信贷 审核 流程 ， 达 到 可 量化 的 自动 化 决策 的 目的 。 

面 对 蓬勃 发 展 的 互联 网 消费 金融 的 风 控 需 求 ， 恒 生 电子 推出 了 大 数据 风 控 平 台 ， 为 中 
小 型 消费 金融 厂商 提供 强大 的 风 控 服 务 ， 从 以 下 3 个 方面 提供 专业 的 大 数据 风 控 支 持 。 

(1) 外 部 数据 源 整合 。 整 合 第 三 方 数据 源 与 征 信服 务 机 构 ， 从 反 苏 诈 、 证 据 保全 到 第 
三 方 征 信 、 电 商 平台 等 多 维度 全 方位 的 数据 与 服务 。 

(2) 风 控 模型 与 评分 。 从 还 款 能 力 与 还 款 意愿 等 多 角度 对 客户 进行 审核 ， 对 不 同 种 类 
的 客户 进行 差异 化 评估 ， 并 基于 评分 卡 进 行 审批 、 授 信 、 差 异化 定价 、 风 险 预 警 、 额 度 调 
整 等 流程 的 设计 ， 实 现 信贷 工厂 的 批量 化 与 规模 化 的 要 求 。 

(3) 自动 化 决策 。 针 对 互联 网 消费 金融 的 快速 放贷 的 要 求 ， 搭 建 了 一 套 自动 化 决策 模 
型 和 风 控 体系 ， 进 行 欺诈 风险 的 评估 ， 计 算 信用 风险 等 级 ， 并 给 出 可 信任 的 参考 授信 和 额 
度 ， 达 到 快速 授信 、 实 时 放贷 的 目的 。 

那么 ， 如 何 对 互联 网 消费 金融 实现 有 效 的 大 数据 风 控 呢 ? 

首先 ， 运 用 大 数据 技术 对 互联 网 消费 金融 业务 进行 风 控 ， 一 定 要 与 消费 场景 相 结合 ， 
把 大 数据 风 控 植 入 一 个 个 消费 场景 中 。 消 费 金 融 的 场景 化 有 助 于 明确 贷款 的 实际 用 途 ， 避 
免 了 贷款 挪 为 他 用 所 造成 的 风险 。 除 了 网 购 之 外 ， 教 育 培训 、 旅 行 、 租 房 、 购 车 、 婚 庆 、 
美容 等 020 场景 都 具有 良好 的 消费 金融 属性 。 不 同 的 场景 有 不 同 的 用 户 群 ， 消 费 金融 公 
司 需要 设计 各 不 相同 的 消费 金融 产品 和 制定 有 针对 性 的 贷款 政策 ， 而 利用 大 数据 技术 可 以 
通过 数据 的 采集 与 分 析 、 各 个 消费 场景 和 消费 群体 的 特点 ， 确 定 差异 化 的 贷款 政策 。 

再 次 ， 还 要 加 强 对 网 络 苏 诈 的 重点 防 控 。 互 联网 消费 金融 具有 互联 网 的 特殊 性 ， 一 般 
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为 纯 线 上 交易 ， 容 易 被 不 法 团伙 所 利用 ， 产 生 盗号 、 套 现 等 欺诈 行为 ， 且 网 络 其 诈 作案 手 
段 隐蔽 、 形 式 多 样 ， 扩 散 也 极 快 ， 对 风险 控制 提出 了 很 高 的 要 求 。 

最 后 ， 可 以 运用 多 种 风险 分 散 手段 ， 如 与 保险 和 担保 机 构 合作 。 保 险 机 构 在 提供 各 种 
信用 保证 保险 产品 的 同时 ， 也 可 将 其 自身 的 征 信 服务 提供 出 来 ; 担保 公司 由 于 在 风险 防范 
机 制 上 比较 专业 ， 可 用 来 完善 消费 金融 公司 自身 的 风 控 模 型 。 


6.4.2 案例 : 芝麻 信用 


芝麻 信用 ， 是 蚂蚁 金 服 旗下 独立 的 第 三 方 征 信 机 构 ， 通 过 云 计算 、 机 器 学 习 等 技术 客 
观 呈 现 个 人 的 信用 状况 ， 已 经 在 信用 卡 、 消 费 金融 、 融 资 租赁 等 上 百 个 场景 为 用 户 、 商 户 
提供 信用 服务 。 它 运用 大 数据 技术 ， 从 个 人 用 户 的 信用 历史 、 行 为 偏好 、 履 约 能 力 、 身 份 
特质 和 人 脉 关系 5 个 维度 ， 对 个 人 信用 予以 评价 并 将 其 量化 成 为 芝麻 信用 分 。 芝 麻 信 用 分 
越 高 ， 代 表 用 户 的 信用 状况 越 好 。 

(1) 在 数据 来 源 方面 。 芝 麻 信 用 除了 使 用 强大 的 淘宝 、 天 猫 电 商 数据 以 及 支付 宝 金融 
数据 之 外 ， 还 涵盖 了 信用 卡 还 款 、 网 购 、 转 账 、 理 财 、 水 电 煤 缴费 、 租 房 信息 、 住 址 搬迁 
历史 、 社 交 关 系 等 。 用 户 信 用 分 的 高 低 与 网 购 量 、 财 产 多 少 没有 直接 联系 ， 而 是 与 他 平时 
的 守信 程度 有 关 。 此 外 ， 芝 麻 信 用 还 与 公安 网 等 众多 公共 机 构 有 深入 的 数据 合作 关系 ， 同 
时 也 将 开辟 各 类 渠道 允许 用 户主 动 提 交 各 类 信用 相关 信息 。 

(2) 在 数据 算法 方面 。 芝 麻 信 用 体系 将 包括 芝麻 分 、 芝 麻 认 证 、 风 险 名 单 库 、 芝 麻 信 
用 报告 、 芝 麻 评级 等 一 系列 信用 产品 ， 背 后 则 是 依托 阿里 云 的 技术 力量 ， 对 3 亿 多 实名 个 
人 、3700 多 万 户 中 小 微 企业 数据 进行 整合 。 借 助 阿 里 云 ， 不 论 是 从 算法 准确 率 上 来 说 还 是 
从 安全 、 稳 定 等 多 个 方面 来 讲 ， 芝 麻 信 用 都 具有 非常 优越 的 领先 条 件 。 

(3) 在 获取 用 户 入 口 方面 。 阿 里 芝麻 信用 通过 依托 于 支付 宝 平台 ， 很 快 就 获得 了 快速 
稳定 的 用 户 增长 ， 这 个 优势 是 其 他 平台 所 不 具备 的 。 依 托 于 支付 宝 ， 凌 驾 于 淘宝 、 天 猫 等 
购物 商城 之 上 ， 芝 麻 信 用 很 快 就 推出 了 蚂蚁 花 呐 、 蝎 蚁 借 呐 等 信用 产品 ， 并 与 招 联 金融 旗 
下 的 “好 期 贷 ” 达 成 了 战略 合作 ， 全 面 进军 消费 金融 领域 。 蝎 蚁 借 呐 3 秒 钟 便 可 完成 放 
贷 ， 最 高 可 以 获得 5 万 元 的 消费 贷款 ， 钱 直接 从 余额 宝 余额 转 出 ， 用 途 不 限 ， 非 常 方便 。 


本 章 总 结 


e@ ”大 数据 技术 在 第 三 方 支付 行业 中 主要 是 应 用 于 防范 欺诈 风险 ， 第 三 方 支付 公司 通 
过 IT 技术 建立 云端 的 动态 数据 库 ， 收 纳 客户 的 基本 信息 ， 并 通过 一 定 的 算法 建 
立 风 险 控制 模型 。 在 第 三 方 支付 的 注册 场景 、 登 录 场 景 、 绑 卡 场景 以 及 支付 场景 
中 大 数据 技术 在 欺诈 风险 控制 方面 发 挥 着 重要 的 作用 。 

@ 网络 借 贷 平 台 主 要 利用 大 数据 技术 中 的 一 些 重要 的 算法 构建 推荐 系统 ， 例如 协 
调 过 滤 推 荐 、 基 于 内 容 的 推荐 以 及 基于 知识 的 推荐 等 。 许 多 P2P 网 站 都 不 同 程度 
地 使 用 各 种 形式 的 推荐 系统 ， 从 而 提高 网 站 的 服务 能 力 ， 有 效 地 发 展 及 保留 了 
客户 。 
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e ”在 供应 链 金 融 中 ， 大 数据 技术 主要 应 用 于 企业 的 信用 评估 ， 通 过 构建 信用 评分 模 
型 来 对 企业 的 信用 状况 进行 评价 ， 从 而 确定 企业 合理 的 授信 额度 。 目 前 一 些 人 工 
智能 的 方法 已 经 被 应 用 到 该 领域 ， 例 如 人 工 神 经 网 络 、 决 策 树 、 贝 叶 斯 分 类 器 
等 。PSO-BP 模式 是 最 为 典型 的 一 个 信用 评估 模型 ， 与 其 他 的 信用 评估 模型 相 比 
它 的 准确 率 较 高 。 

e@ ”在 互联 网 消费 金融 行业 中 ， 大 数据 技术 主要 应 用 于 征 信 以 及 风险 管控 。 由 于 消费 
金融 具有 无 抵押 、 以 信用 为 基础 的 特点 ， 因 此 信用 风险 是 一 个 非常 重要 的 问题 。 
通过 外 部 数据 源 整合 、 风 控 模 型 与 评分 、 自 动 化 决策 等 大 数据 技术 为 互联 网 消费 
金融 机 构 提供 强 有 力 的 风 控 支持 。 


1. 第 三 方 支 付 的 欺诈 风险 主要 体现 在 哪些 方面 7 你 认为 第 三 方 支付 机 构 在 欺诈 风险 管 
理 方面 应 该 承担 哪些 责任 ? 

2. 第 三 方 支付 中 注册 场景 、 登 录 场 景 、 绑 卡 场景 以 及 支付 场景 中 的 欺诈 风险 的 具体 表 
现形 式 是 什么 ?” 如何 利用 大 数据 技术 在 这 4 个 场景 中 防范 欺诈 风险 ? 

3. 什么 是 推荐 系统 ? 它 主 要 包括 哪些 模块 ?举例 说 明日 常 经 济 生活 中 的 推荐 系统 。 

4. 试 述 推荐 系统 中 几 个 重要 的 推荐 算法 。 

5. 个 性 化 推荐 系统 对 P2P 平台 有 哪些 作用 ? 

6. 什么 是 供应 链 融 资 ?什么 是 互联 网 供应 链 融 资 ? 根据 经 营 主体 的 不 同 ， 互 联网 供应 
链 融资 可 以 分 为 哪 几 类 ? 

7. 简 述 基于 PSO-BP 集成 的 企业 信用 分 的 产生 过 程 。 

8. 阅读 本 章 6.3.2 小 节 的 案例 ， 简 述 京东 是 如 何 将 大 数据 技术 运用 到 互联 网 供应 链 融 
资中 的 ? 

9. 如 何 对 互联 网 消费 金融 进行 大 数据 征 信 与 风 控 ? 

10. 阅读 本 章 6.4.2 小 节 的 案例 ， 试 述 芝麻 信用 是 如 何 利用 大 数据 进行 征 信 和 风 控 的 ? 
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> 。@ 理解 并 掌握 传统 征 信 的 含义 、 e@ 理解 并 掌握 大 数据 征 信 的 含 
目 原则 、 分 类 及 特征 ; 了 解 传统 义 、 优 势 及 难题 ， 了 解 其 理论 
标 征 信 的 基本 流程 基础 ， 并 知晓 大 数据 征 信 出 现 
@@ 掌握 传统 征 信 产品 、 机 构 及 的 必然 性 
体系 @ 掌握 大 数据 征 信 流 程 ; 了 解 国 
内 外 典型 大 数据 征 信 企 业 


数据 是 征 信 业务 开展 的 基础 资料 。 征 信 活 动 主要 是 围绕 数据 进行 采集 、 整 理 、 
保存 、 加 工 ， 并 最 终 向 信息 使 用 者 提供 。 大 数据 不 仅 为 征 信 业 发 展 提供 了 极为 丰富 
的 数据 信息 资源 ， 也 改变 了 征 信 产 品 设计 和 生产 理念 ， 成 为 未 来 征 信 业 发 展 最 重要 
的 基石 。 

我 国 征 信 业 发 展 尚 处 于 起 步 阶段 ， 在 大 数据 时 代 存 在 征 信 法 律 制度 和 业务 规则 
不 够 完善 、 征 信 机 构 数据 处 理 能 力 有 待 提高 等 问题 。 未 来 征 信 业 面临 的 机 遇 和 挑战 
并 存 ， 研 究 大 数据 时 代 征 信 业 的 发 展 具有 重要 意义 。 

本 章 从 传统 征 信 入 手 ， 详 细 阑 述 了 传统 征 信 的 含义 、 原 则 、 分 类 及 特征 ， 大 致 
介绍 传统 征 信 的 基本 流程 ， 并 全 面 叙述 传统 征 信 产品 、 机 构 及 体系 ; 进而 讲述 了 大 
数据 征 信 的 含义 ， 并 与 传统 征 信 对 比 盖 述 其 优势 和 难题 ， 从 各 个 角度 说 明 大 数据 出 
现 的 必然 性 ; 最 后 以 典型 大 数据 征 信 企业 作为 突破 口 ， 立 体 叙述 了 在 实践 中 的 大 数 
据 征 信 流程 ， 并 对 典型 大 数据 征 信 企业 的 运作 和 征 信 模 式 做 了 大 致 的 介绍 。 


人 kanausttf 
(OEE 传统 征 信 


7.1.1 征 信 概 述 


19 世纪 初 ， 英 国 常 有 “绅士 不 付 裁缝 账 ”的 现象 ， 伦 敦 的 裁 颖 们 为 绅士 和 贵族 定做 衣 
服 是 做 好 之 后 再 收 钱 ， 结 果 总 有 一 些 客户 不 及 时 付款 或 故意 赖账 ， 这 样 给 裁 颖 们 造成 了 很 
大 损失 。 于 是 ， 为 保护 自身 和 利益， 裁缝 们 创立 了 一 个 交流 其 客户 支付 习惯 信息 的 机 制 ， 拒 
绝 为 那些 信用 不 良 的 客户 们 服务 。 从 这 个 征 信和 制度 的 雏形 可 以 看 出 ， 征 信 活 动 是 在 授信 人 
之 间 形 成 一 种 分 享 客 户 信用 信息 的 机 制 。 

随 着 市 场 经 济 的 发 展 ， 授 信 活 动 或 信用 活动 在 市 场 交 易 中 日 益 频 繁 。 全 社会 特别 是 授 
信人 、 投 资 人 对 征 信服 务 的 需求 也 不 断 增长 ， 征 信 业 开始 在 世界 各 地 蓬勃 发 展 起 来 。 相 对 
于 “社会 信用 体系 ”“ 诚 信 体 系 ”等 词 来 说 ，“ 征 信 ” 的 概念 在 国际 上 是 有 共识 的 。“ 征 
舍 ” 对 应 英语 中 最 合适 的 词 是 credit reference， 这 里 的 “ 信 ” 即 “信用 ”，credit 是 指 经 济 
层面 上 的 信用 。 

1. 征 信 的 含义 


征 信 是 指 征 信 机 构 作 为 信用 交易 双方 之 外 的 独立 第 三 方 ， 收 集 、 整 理 、 保 存 、 加 工 个 
人 、 法 人 及 其 他 组 织 的 信用 信息 ， 以 在 一 定 程度 上 揭示 信息 主体 的 信用 风险 状况 ， 协 助 授 
信人 或 投资 人 进行 风险 管理 的 一 种 信息 服务 活动 。 简 而 言 之 ， 征 信 的 本 质 就 是 为 授信 机 构 
或 投资 人 的 决策 提供 信息 参考 ， 是 授信 人 或 投资 人 之 间 的 一 种 信息 分 享 机 制 。 

这 一 定义 包含 了 4 个 方面 的 主要 内 容 。 

(1) 这 里 的 信用 交易 是 广义 的 ， 是 指 任何 购买 (商品 和 服务 等 ) 支 付 不 是 同时 进行 的 
交易 。 

(2) 这 里 的 第 三 方 机 构 就 是 征 信服 务 机 构 。 而 与 征 信服 务 相 关 的 服务 产品 、 价 格 、 市 
场 以 及 征 信服 务 的 主体 、 法 规 管理 等 之 和 ， 就 是 征 信 体 系 。 换 句 话说 ， 征 信 体 系 指 的 是 与 
征 信 活动 有 关 的 法 律 规 章 、 组 织 机 构 、 市 场 管理 等 共同 构成 的 一 个 体系 。 

(3) 征 信 体系 的 主要 功能 是 为 借贷 市 场 服务 ， 但 也 可 服务 于 商品 市 场 和 劳动 力 市 场 ， 
只 要 有 信用 发 生 ， 授 信 方 就 有 征 信和 需求 。 

(4) 这 是 一 个 特殊 的 信息 服务 业 。 它 的 特殊 性 主要 表现 在 两 个 方面 : 一 是 信息 的 特殊 
性 ， 即 它 是 反映 信息 主体 (企业 或 个 人 ) 信 用 状况 的 信息 ; 二 是 功能 的 特殊 性 ， 除 了 直接 为 
授信 机 构 提供 的 服务 功能 ， 还 具有 促进 全 社会 珍惜 自己 的 信用 状况 、 注 重 诚实 守信 等 延伸 
的 社会 功能 ， 有 利于 构建 和 谐 社会 。 


2. 征 信 的 原则 


征 信 的 原则 是 征 信 业 在 长 期 发 展 过 程 中 逐渐 形成 的 科学 的 指导 原则 ， 是 征 信 活 动 顺 利 
开展 的 根本 。 通 常 ， 我 们 将 其 归纳 为 真实 性 原则 、 全 面 性 原则 、 及 时 性 原则 及 隐私 和 商业 
秘密 保护 原则 。 
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1) ”真实 性 原则 

真实 性 原则 ， 是 指 在 征 信 过 程 中 征 信 机 构 应 采取 适当 的 方法 核实 原始 资料 的 真实 性 ， 
以 保证 所 采集 的 信用 信息 是 真实 的 ， 这 是 征 信 工作 最 重要 的 条 件 。 

只 有 信息 准确 无 误 ， 才 能 正确 反映 被 征 信 人 的 信用 状况 ， 保 证 对 被 征 信 人 的 公平 。 真 
实 性 原则 有 效 地 反映 了 征 信 活动 的 科学 性 。 征 信 机 构 应 基于 第 三 方 立 场 提供 被 征 信人 的 历 
史 信 用 记录 ， 对 信用 报告 的 内 容 ， 不 妄 下 结论 ， 在 信用 报告 中 要 气 弃 含有 虚伪 偏 祖 的 成 
分 ， 以 保持 客观 中 立 的 立场 。 基 于 此 原则 ， 征 信 机 构 应 给 予 被 征 信 人 一 定 的 知情 权 和 申诉 
权 ， 以 便 能 够 及 时 纠正 错误 的 信用 信息 ， 确 保 信用 信息 的 准确 性 。 

2) 全面 性 原则 

全 面 性 原则 又 称 完 整 性 原则 ， 是 指 征 信 工作 要 做 到 资料 全 面 、 内 容 明 晰 。 

被 征 信人 ， 不 论 企业 或 个 人 ， 均 处 在 一 个 开放 性 的 经 济 环境 中 。 人 格 、 财 务 、 资 产 、 
生产 、 管 理 、 行 销 、 人 事 和 经 济 环境 等 要 素 虽 然 性 质 互 异 ， 但 都 具有 密切 的 关联 ， 直 接 或 
间接 地 在 不 同 程度 上 影响 着 被 征 信 人 的 信用 水 平 。 不 过 ， 征 信 机 构 往往 搜集 客户 历史 信用 
记录 等 负债 信息 ， 通 过 其 在 履约 中 的 历史 表现 ， 判 断 该 信息 主体 的 信用 状况 。 历 史 信用 记 
录 既 包括 正面 信息 ， 也 包括 负面 信息 。 正 面 信息 是 指 客户 正常 的 基础 信息 、 贷 款 、 财 销 、 
支付 等 信用 信息 ;负面 信息 是 指 客户 欠 款 、 破 产 、 诉 讼 等 信息 。 负 面 信息 可 以 帮助 授信 人 
快速 甄别 客户 信用 状况 ， 正 面 信 息 能 够 全 面 反 映 客户 的 信用 状况 。 

3) ”及 时 性 原则 

及 时 性 原则 ， 是 指 征 信 机 构 在 采集 信息 时 要 尽量 实现 实时 跟踪 ， 能 够 使 用 被 征 信 人 最 
新 的 信用 记录 ， 反 映 其 最 新 的 信用 状况 ， 避 免 因 不 能 及 时 掌握 被 征 信 人 的 信用 变动 而 为 授 
信 机 构 带 来 损失 。 

信息 及 时 性 关系 到 征 信 机 构 的 生命 力 ， 从 征 信 机 构 发 展 历史 看 ， 许 多 征 信 机 构 由 于 不 
能 及 时 更 新 信息 ， 授 信 机 构 难 以 据 此 及 时 判断 被 征 信人 的 信用 风险 ， 而 导致 最 终 难以 经 营 
下 去 。 目 前 ,我 国 许多 征 信 机 构 也 因此 处 于 经 营 困境 。 

4) ”隐私 和 商业 秘密 保护 原则 

对 被 征 信 人 隐私 或 商业 秘密 进行 保护 是 征 信 机 构 最 基本 的 职业 道德 ， 也 是 征 信 立法 的 
主要 内 容 之 一 。 

征 信 机 构 应 建立 严格 的 业务 规章 和 内 控制 度 ， 谨 慎 处 理 信用 信息 ， 保 障 被 征 信 人 的 信 
用 信息 安全 。 在 征 信 过 程 中 ， 征 信 机 构 应 明确 征 信 信息 和 个 人 隐私 与 企业 商业 秘密 之 间 的 
界限 ， 严 格 遵守 隐私 和 商业 秘密 保护 原则 ， 才 能 保证 征 信 活动 的 顺利 开展 。 


3. 征 信 的 分 类 


征 信 的 分 类 如 图 7.1 所 示 。 

1)” 按 业务 模式 可 分 为 企业 征 信 和 个 人 征 信 两 类 

企业 征 信 主 要 是 收集 企业 信用 信息 、 生 产 企 业 信用 产品 的 机 构 ; 个 人 征 信 主要 是 收集 
个 人 信用 信息 、 生 产 个 人 信用 产品 的 机 构 。 

有 些 国家 这 两 种 业务 类 型 由 一 个 机 构 完 成 ， 也 有 的 国家 是 由 两 个 或 两 个 以 上 机 构 分 别 
完成 ， 或 者 在 一 个 国家 内 既 有 单独 从 事 个 人 征 信 的 机 构 ， 也 有 从 事 个 人 和 企业 两 种 征 信 业 
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务 类 型 的 机 构 ， 一 般 都 不 加 以 限制 ， 


主要 有 3 种 业务 模式 。 


(1) 资本 市 场 信用 记 


F 估 机 构 ， 其 评估 对 象 为 股票 、 


由 征 信 机 构 根 据 实际 情况 自主 决定 。 美 国 


债券 和 大 型 基建 项 目 。 


的 征 信 机 构 


(2) 商业 市 场 评估 机 构 ， 也 称 为 企业 征 信服 务 公司 ， 其 评估 对 象 为 各 类 大 中 小 企业 。 
估 机 构 ， 其 征 信 对 象 为 消费 者 个 人 。 


(3) 个 人 消费 市 场 订 


按 业 务 模式 分 类 


企业 征 信 : 收集 
企业 信用 信息 ， 
生产 企业 信用 产 
品 的 机 构 


个 人 征 信 : 收集 
个 人 信用 信息 、 
入 个人 信用 产 


2) ” 按 服务 对 象 可 分 为 信贷 征 信 、 


按 服务 对 象 分 类 


按 征 信用 途 分 类 


信贷 征 信 主要 公共 征 信 征 指出 
服务 对 象 是 多 于 社会 管理 需要 ， 
融 机 构 ， 为 信 征 信 结果 免费 提 
贷 决策 提供 六 供给 社会 、 政 府 
持 职能 部 门 、 行 业 
、 商 会 、 联 
商业 征 信 主 要 国内 征 信息 目前 盟 开展 的 征 信 
对 象 是 批 世界 范围 内 最 多 

发 商 或 零售 商 ， 的 机 构 形式 之 一 
为 肉 销 决策 提供 。 ”尤其 是 近年 来 开 直人 A 全 从 
支持 设 征 信 机 构 的 国 2 

案 芝 采取 这 各 和 
雇用 征 信 主 要 内 过 程 不 公 
服务 对 象 是 雇 开 ， 自 产 自 销 
主 ， 为 雇主 用 
人 决策 提供 支持 准 公 基 征 全 到 志 

跨国 征 信 : 为 拓 人 
其 他 征 信 : 诸如 ”展业 务 及 顺应 国 i 
市 场 调查 ,债权 际 化 趋势 ， 近 年 
理 ， 动 之 、 不 。 来 发 展 迅速 | 
动产 鉴定 等 有 

图 7.1 征 信 的 分 类 
商业 征 信 、 雇 用 征 信 及 其 他 征 信 


信贷 征 信 主 要 服务 对 象 是 金融 机 构 ， 为 信贷 决策 提供 支持 ， 商 业 征 信 主 要 服务 对 象 是 


批发 商 或 零售 商 ， 为 内 销 决策 提供 支持 ;雇用 征 信 主 要 服务 对 象 是 雇主 ， 为 雇 了 
策 提供 支持 ， 另 外 ， 还 有 其 他 一 些 征 信 活 动 ， 诸 如 市 场 调 查 ， 


鉴定 等 。 


E 用 人 决 
债权 处 理 ， 动 产 、 不 动产 


各 类 不 同 服务 对 象 的 征 信 业 务 ， 有 的 是 由 一 个 机 构 来 完成 ， 有 的 是 在 围绕 具有 数据 库 
征 信 机 构 上 下 游 的 独立 企业 内 来 完成 。 
3) “ 按 征 信 范 围 可 分 为 区 域 征 信 、 国 
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区 域 征 信 一 般 规模 较 小 ， 只 在 某 一 特定 区 域内 提供 征 信和 朋 
刚 起 步 的 国家 存在 较 多 ， 征 信 业 发 展 到 一 定 阶段 后 ， 
上 的 区 域 征 信 随 之 逐步 消失 ; 国 
年 来 开设 征 信 机 构 的 国家 普遍 采取 这 种 形式 ;跨国 征 信 这 几 生 


R 务 ， 这 种 模式 一 般 在 征 
大 都 走向 兼并 或 专业 细 分 ， 真 正 意义 
内 征 信 是 目前 世界 范围 内 最 多 的 机 构 形 式 之 一 ， 尤 其 是 近 


FE 正在 迅速 崛起 ， 此 类 征 


信 业 


信之 
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所 以 能 够 得 以 快速 发 展 ， 主 要 有 内 在 和 外 在 两 方面 原因 : 内 在 原因 是 西方 国家 一 些 老牌 征 
信 机 构 为 了 拓展 自己 的 业务 ， 采 用 多 种 形式 (如 设立 子 公司 、 合 作 、 参 股 、 提 供 技术 支持 、 
设立 办 事 处 等 ) 向 其 他 国家 渗透 ， 外 在 原因 主要 是 由 于 世界 经 济 一 体 化 进程 的 加 快 ， 各 国 经 
济 互相 渗透 ， 互 相 融 合 ， 跨 国 经 济 实体 越 来 越 多 ， 跨 国 征 信 业务 的 需求 也 越 来 越 多 ， 为 了 
适应 这 种 发 展 趋势 ， 跨 国 征 信 这 种 机 构 形 式 也 必然 越 来 越 多 。 但 由 于 每 个 国家 的 政治 体 
制 、 法 律 体系 、 文 化 背景 不 同 ， 跨 国 征 信 的 发 展 也 受到 一 定 的 制约 。 

4) ” 按 征 信用 途 可 分 为 公共 征 信 、 非 公共 征 信 、 准 公共 征 信 

公共 征 信和 是 指出 于 社会 管理 需要 ， 征 信 结 果 免 费 提供 给 社会 、 政 府 职能 部 门 、 行 业 协 
会 、 商 会 、 联 盟 开 展 的 征 信 。 非 公共 征 信 是 指 征 信用 于 自己 授信 和 业务 管理 ， 其 征 信 过 程 
不 公开 ， 自 产 自 销 ， 其 实质 是 自我 信用 风险 管理 和 控制 ， 银 行 信贷 授信 、 企 业 信 用 销售 中 
对 客户 授信 都 属于 这 类 。 准 公共 征 信 即 专业 征 信 ， 是 独立 第 三 方 开展 的 中 介 服务 ， 其 征 信 
结果 供 社会 查询 使 用 ， 具 有 社会 影响 力 。 

4. 征 信 的 特征 

1) “ 征 信 采集 的 主要 是 信用 信息 

这 是 征 信 的 第 一 特征 。 

信用 信息 是 指 能 够 在 一 定 程度 上 反映 信息 主体 信用 状况 的 信息 。 其 中 ， 最 主要 的 是 与 
信用 交易 相关 的 信息 ， 如 贷款 、 还 款 信 息 及 合同 履约 信息 等 ， 另 一 类 必 不 可 少 的 信息 ， 是 
识别 、 定 位 信息 主体 身份 的 信息 ， 如 名 称 、 身 份 证 件 及 其 代码 、 地 址 、 年 龄 、 性 别 
等 等 。 

世界 上 大 的 征 信 机 构 所 建立 的 征 信 系 统 都 会 采集 三 类 信息 : 身份 识别 信息 、 信 贷 交 易 
信息 和 非 银 行 信用 信息 。 作 为 信用 报告 主体 的 信贷 交易 信息 和 非 银行 信用 信息 主要 都 是 与 
信用 交易 相关 的 信息 。 其 他 非 银行 信息 ， 如 法 院 判决 信息 、 欠 税 信息 、 行 政 处 罚 信息 等 ， 
只 要 是 有 助 于 反映 信息 主体 信用 状况 的 ， 并 且 法 律 不 禁止 ， 也 都 是 可 以 采集 的 。 

2) “ 征 信 需要 建立 个 人 或 企业 的 信息 账户 

信息 账户 是 征 信 活 动 的 核心 和 基础 ， 通 俗 地 说 就 是 一 个 企业 或 个 人 的 信用 信息 档案 ， 
即 把 一 个 信息 主体 在 各 行 各 业 同 其 他 市 场 主体 的 信用 交易 活动 中 产生 的 信用 记录 都 整合 到 
三 个 账户 之 下 。 

在 我 国 ， 最 早 的 企业 信用 信息 档案 可 追溯 到 20 世纪 90 年 代 ， 深 圳 人 民 银 行 推出 的 纸 
质 “ 贷 款 证 ”。 人 民 银 行 在 推广 深圳 “贷款 证 ”制度 并 借鉴 国外 经 验 的 基础 上 ， 建 立 起 的 
全 国 集中 统一 的 企业 和 个 人 征 信 系统 ， 就 是 为 有 信贷 交易 活动 的 企业 、 其 他 组 织 和 个 人 建 
立 的 信息 账户 数据 库 。 在 信息 账户 中 ， 信 息 是 需要 不 断 更 新 的 ， 这 是 征 信 系 统 价值 的 
核心 。 

3) ” 征 信服 务 主 要 是 一 种 微观 的 信息 中 介 服 务 

征 信 具有 微观 性 ， 在 征 信 活动 的 两 端 都 表现 得 很 清楚 。 

从 数据 采集 环节 看 ， 征 信 就 是 尽 可 能 全 面 地 把 信息 主体 在 各 行业 授信 服务 、 消 费 和 投 
资 活动 中 留 下 的 信用 记录 ， 形 成 微观 经 济 活动 主体 一 一 企业 和 个 人 的 信用 报告 。 从 信息 使 
用 环节 看 ， 通 过 接受 征 信服 务 ， 商 业 银行 有 效 地 加 强 了 对 信贷 业务 、 信 用 卡 和 授信 客户 的 
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信用 风险 管理 。 所 以 ， 无 论 从 企业 征 信 还 是 个 人 征 信 的 角度 来 看 ， 征 信服 务 都 主要 是 一 种 
微观 的 信息 中 介 服 务 ， 而 不 是 宏观 的 信息 服务 活动 。 
当然 ， 征 信也 可 以 在 微观 账户 数据 基础 上 进行 汇总 统计 和 分 析 ， 为 宏观 经 济 金融 分 析 
服务 ， 但 这 是 征 信服 务 的 附加 产品 或 增值 服务 。 征 信服 务 应 与 行政 部 门 的 统计 服务 职能 区 
分 开 来 ， 不 应 发 生 冲 突 。 

4) ” 征 信和 是 一 个 行业 

由 征 信 的 发 展 史 可 以 看 出 ， 征 信 就 是 从 市 场 经 济 这 个 环境 中 自然 而 然 地 孕育 出 来 ， 为 
解决 交易 双方 信息 不 对 称 问 题 的 专业 化 服务 。 也 正 因为 有 市 场 需 求 ， 征 信 才 会 发 展 成 为 一 
个 专门 的 特殊 的 信用 信息 服务 行业 。 

在 我 国 ， 征 信 基 本 上 是 从 银行 “贷款 三 查 ”( 贷 前 调查 、 贷 中 审查 和 贷 后 检查 ) 工 作 中 
分 离 出 来 的 ， 是 银行 业 分 工 进化 的 产物 。 征 信 机 构 每 天 为 世界 各 地 的 授信 机 构 提 供 数 以 百 
万 计 的 各 类 征 信 服务 ， 除 信用 报告 外 ， 还 提供 包括 评分 模型 开发 、 防 欺诈 解决 方案 、 策 略 
决策 引擎 服务 、 信 息 技术 解决 方案 、 市 场 营 销 服务 等 。 

5) ” 征 信 活动 的 主要 服务 对 象 是 授信 机 构 

征 信 的 实践 活动 表明 ， 不 仅 征 信 的 主要 服务 对 象 是 授信 机 构 ， 而 且 给 征 信 机 构 提供 原 
始 数据 的 ， 也 主要 是 授信 机 构 。 也 正 因为 授信 机 构 有 强烈 的 需求 ， 才 会 有 动力 与 征 信 机 构 
建立 起 长 期 、 稳 定 的 数据 报 送 关系 。 

市 场 经 济 中 授信 活动 普遍 存在 ， 不 限于 一 两 个 行业 。 授 信 机 构 目 前 在 我 国 主要 是 指 商 
业 银 行 ， 但 授信 并 不 是 银行 的 特权 。 除 银行 以 外 ， 还 有 很 多 其 他 的 机 构 ， 如 小 额 贷款 公 
司 、 公 积 金 中 心 、 电 信 公 司 等 授信 机 构 。 理 论 上 ， 只 要 是 属于 先 消费 或 先 取 货 ， 后 付款 的 
交易 ， 都 是 信用 交易 或 授信 活动 。 在 一 些 欧美 国家 ， 授 信 机 构 的 范围 还 要 广泛 ， 如 有 些 大 
的 超市 也 可 以 发 信用 卡 。 

6) ” 征 信 和 是 一 种 信息 分 享 机 制 

这 种 信息 分 享 机 制 ， 只 是 一 定 范围 内 的 共享 ， 并 不 能 等 同 于 信息 的 无 限制 的 、 向 社会 
公众 的 公开 披露 。 就 是 说 ， 征 信和 产品 的 使 用 ， 即 便 在 授信 机 构 之 间 ， 也 是 有 限制 的 使 用 ， 
通常 是 依法 依 规 使 用 。 这 是 由 信用 信息 的 性 质 决 定 的 ， 因 为 它 是 商务 信息 ， 是 反映 信息 主 
体 信 用 状况 的 敏感 信息 。 

虽然 人 们 对 不 同 敏感 程度 的 信息 应 该 在 什么 范围 内 分 享 会 有 不 同 的 认识 ， 但 不 能 由 此 
把 范围 较 大 的 分 享 理解 为 信息 公开 。 尤 其 是 在 目前 征 信 系 统 建设 的 初期 ， 因 人 缺少 相关 法 律 
法 规 的 指引 ， 人 们 对 信息 分 享 的 范围 和 参与 分 享 的 主体 种 类 存在 不 一 致 认识 ， 所 以 需要 采 
取 谨 慎 的 态度 ， 更 好 地 把 好 信息 使 用 关 。 另 外 ， 信 息 的 敏感 程度 不 一 样 ， 分 享 的 范围 也 不 
一 样 。 更 好 的 、 精 细 的 分 享 机 制 ， 应 该 是 分 层 共享 ， 即 向 征 信 系 统 报 送 什么 数据 ， 方 能 分 
享 什么 信息 。 

7) ” 征 信 服务 宜 由 独立 于 信用 交易 当事人 的 第 三 方 提供 

征 信 业 因 其 独特 的 行业 特点 ， 要 求 其 保持 很 高 的 公信 力 。 因 此 ， 虽 然 个 别 大 的 商业 银 
行 也 有 能 力 开展 此 项 工作 ， 但 为 了 避免 利益 冲突 ， 只 能 由 独立 于 信贷 业务 之 外 的 专业 征 信 
机 构 来 做 这 项 工作 。 征 信 机 构 本 身 是 不 能 直接 从 事 授信 业务 的 。 

征 信 机 构 的 独立 性 ， 还 体现 在 对 原始 数据 的 独立 性 上 ， 即 征 信 系 统 存储 的 关于 各 个 信 
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息 主体 的 原始 数据 ， 都 是 数据 报 送 机 构 报 送 到 系统 的 ， 征 信 机 构 无 权 修 改 ， 即 便 信 用 报告 
被 确认 有 错误 ， 也 只 能 按 流 程 由 报 送 机 构 自 己 或 由 其 授权 ， 才 能 更 正 原始 数据 的 错误 。 这 
种 独立 性 是 保证 征 信 机 构 公信 力 的 必要 机 制 。 

8) ” 征 信 的 功能 是 在 一 定 程度 上 揭示 信息 主体 的 信用 状况 

其 采集 的 信息 作为 参考 信息 ， 可 协助 授信 人 或 投资 人 更 好 地 做 出 授信 或 投资 决策 。 信 
用 报告 中 的 原始 信用 交易 信息 及 征 信 增 值 产品 如 评分 ， 都 是 用 来 帮助 授信 机 构 预测 授信 人 
未 来 的 违约 率 ， 以 帮助 授信 机 构 改善 信用 风险 管理 。 

这 里 所 说 的 “一 定 程度 上 ”意思 是 指 不 同 深度 的 征 信 活 动 ， 如 基础 征 信 或 信用 报告 、 
信用 调查 、 信 用 评级 等 业务 活动 ， 揭 示 信 用 状况 的 程度 是 不 同 的 。 

需要 特别 注意 的 是 ， 信 用 报告 和 信用 综合 评价 产品 (如 评级 、 评 分 等 ) 并 不 是 对 评价 对 
象 诚信 道德 的 评判 ， 尽 管 诚 信道 德 自身 会 对 履约 、 信 用 状况 产生 一 定 影响 。 如 果 把 征 信 活 
动 与 对 信息 主体 的 诚信 道德 评价 等 同 起 来 ， 则 有 把 征 信 业 引 向 歧途 的 危险 。 实 际 上 ， 世 界 
上 还 没有 哪 一 个 国家 有 自动 化 的 信息 系统 ， 试 图 对 信息 主体 的 道德 进行 评价 。 对 一 个 人 的 
道德 评价 是 非常 综合 和 复杂 的 。 

9) ”发展 征 信 业 应 更 多 引入 市 场 机 制 

征 信 活 动 主要 是 市 场 经 济 的 产物 ， 其 运作 也 宜 更 多 引入 市 场 机 制 。 

一 是 征 信 作 为 一 种 微观 服务 ， 是 为 了 满足 商业 活动 的 需要 。 尽 管 征 信 机 构 也 为 政府 部 
门 等 公共 部 门 提供 服务 ， 但 我 们 不 能 因此 而 把 征 信服 务 归 为 公共 产品 ， 征 信 主 要 是 为 市 场 
化 的 授信 机 构 服 务 的 。 已 经 实现 市 场 化 运作 的 授信 机 构 ， 对 征 信服 务 的 需求 随 市 场 变化 而 
变化 ， 这 就 要 求 征 信 业 以 十 分 灵活 的 机 制 来 满足 。 二 是 征 信 专 业 服务 的 特征 决定 了 由 政府 
主导 的 公共 机 构 不 能 充分 发 挥 其 功能 。 尽 管 世界 上 仍然 存在 一 些 由 公共 机 构 直 接 运 作 的 征 
信 系统 ， 但 其 趋势 是 日 渐 式微 的 。 

目前 ， 国 际 上 处 于 征 信 业 垄 断 地 位 的 个 人 和 企业 征 信 局 均 是 市 场 化 的 征 信 机 构 ， 都 是 
采取 市 场 化 的 运作 方式 。 这 是 保持 较 高 的 服务 效率 的 需要 。 

10) 征 信 行业 是 依赖 于 法 律 法 规 ， 并 受 社会 文化 环境 影响 较 大 的 新 兴 行 业 

征 信 数据 的 采集 需要 法 律 的 支持 ， 才 能 更 好 地 进行 。 征 信 产 品 可 以 在 什么 范围 使 用 ， 
同样 需要 法 律 明确 界定 ， 才 会 避免 争论 。 如 何在 促进 征 信 体系 发 展 与 保护 信息 主体 权益 之 
间 取 得 适当 平衡 ， 是 征 信 立 法 需要 解决 的 主要 问题 。 

目前 ， 我 国 征 信 业 务 还 处 于 发 展 的 初级 阶段 ， 有 关 法 规 还 较 少 ， 只 有 中 国人 民 银 行 
2005 年 发 布 的 一 个 “3 号 令 ”， 即 《个 人 信用 信息 基础 数据 库 管 理 暂行 办 法 》。 因 文化 环 
境 、 道 德 理念 等 的 不 同 ， 征 信 活 动 的 法 规 在 不 同类 型 国家 呈现 出 很 大 的 差异 性 。 如 美国 ， 
有 隐私 法 和 公平 信用 报告 法 ， 英国， 只 有 数据 保护 法 ;澳大利亚 有 数据 保护 法 和 征 信 机 构 
行为 守则 ; 印度 和 俄罗斯 等 新 兴 市 场 经 济 国 家 ， 也 有 专门 的 规范 征 信 机 构 的 法 规 。 

5. 征 信 的 作用 


征 信 活 动 服务 的 范围 很 广 ， 如 金融 业 、 电 信 业 、 公 共事 业 、 政 府 部 门 等 ， 从 这 些 服务 
对 象 的 不 同 角度 出 发 ， 可 以 总 结 出 征 信 具 有 以 下 6 个 作用 。 
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1) ”防范 信用 风险 ， 促 进 信贷 市 场 发 展 

随机 波动 理论 认为 ， 股 价 波动 遵循 随机 波动 ， 呈 现 典 型 的 马尔 可 夫 性 质 ， 股 价 过 去 的 
历史 和 从 过 去 到 现在 的 演变 方式 与 股价 的 未 来 变动 不 相关 。 但 是 ， 对 于 单一 个 体 而 言 ， 人 
类 行为 在 很 大 程度 上 则 具有 路 径 依 赖 的 特点 ， 预 测 一 个 人 未 来 行为 的 最 好 方法 是 看 其 过 去 
的 表现 ， 这 一 点 成 为 社会 信用 体系 建设 的 理论 基础 。 

银行 如 果 不 了 解 企业 和 个 人 的 信用 状况 ， 为 了 防范 风险 ， 就 会 采取 相对 紧缩 的 信贷 政 
策 。 通 过 征 信 活 动 ， 查 阅 被 征 信人 以 前 的 历史 记录 ， 商 业 银 行 能 够 比较 方便 地 了 解 企业 和 
个 人 的 信用 状况 ， 采 取 相 对 灵活 的 信贷 政策 ， 扩 大 信贷 范围 ， 特 别 是 对 缺少 抵押 品 的 中 小 
企业 、 中 低 收 入 者 等 边缘 借款 人 。 

2) ”服务 其 他 授信 市 场 ， 提 高 履约 水 平 

现代 经 济 的 核心 是 信用 经 济 。 授 信 市 场 包 含 的 范围 非常 广泛 ， 除 银行 信贷 外 ， 还 包括 
大 量 的 授信 活动 ， 如 企业 和 企业 (多 以 应 收 账 款 形式 存在 )、 企 业 和 个 人 (各 种 购物 卡 、 消 费 
卡 等 )、 个 人 与 个 人 (借款 ) 之 间 的 授信 活动 ， 一 些 从 事 授信 中 介 活 动 的 机 构 ， 如 担保 公司 、 
租赁 公司 、 保 险 公 司 、 电 信 公 司 等 ， 在 开展 业务 时 均 需 要 了 解 受信 方 的 信用 状况 。 

征 信 活 动 通过 信息 共享 、 各 种 风险 评估 等 手段 将 受信 方 的 信息 人 全面、 准确、 及 时 地 传 
递 给 授信 方 ， 有 效 揭示 受信 方 的 信用 状况 ， 采 用 的 手段 有 信用 报告 、 信 用 评分 、 资 信 评 
级 等 。 

3) ”加 强 金融 监管 和 宏观 调控 ， 维 护 金融 稳定 

通过 征 信 机 构 强大 的 征 信 数 据 库 ， 收 录 工 商 登 记 、 信 贷 记 录 、 纳 税 记录 、 合 同 履约 、 
民事 司法 判决 、 产 品质 量 、 身 份 证 明 等 多 方面 的 信息 ， 以 综合 反映 企业 或 个 人 的 信用 状 
况 。 当 从 更 为 宏观 的 角度 进行 数据 分 析 时 ， 则 可 以 整合 出 一 个 企业 集团 、 一 个 行业 和 国家 
整体 的 信用 风险 状况 。 因 此 ， 可 以 按照 不 同 的 监管 和 调控 需要 ， 对 信贷 市 场 、 宏 观 经 济 的 
运行 状况 进行 全 面 、 深 入 的 统计 和 分 析 ， 统 计 出 不 同 地 区 、 不 同 金融 机 构 、 不 同行 业 和 各 
类 机 构 、 人 和 群 的 负债 、 坏 账 水 平等 ， 从 而 为 加 强 金融 监管 和 宏观 调控 创造 条 件 。 

征 信 对 监管 者 的 帮助 主要 有 两 个 : 监控 总 体 信 贷 质 量 、 测 试 银行 是 否 满足 监管 要 求 
(尤其 是 满足 新 巴塞 尔 资本 协议 要 求 )。 例 如 ， 意 大 利 的 监管 机 构 就 利用 征 信 数据 库 来 测算 
商业 银行 的 资本 金 要 求 、 总 体 风险 构成 等 ， 作 为 对 商业 银行 进行 监管 依据 的 外 部 补充 。 
@ 征 信 对 宏观 调控 者 的 帮助 主要 体现 在 通过 整体 违约 率 的 测算 来 判断 经 济 目前 所 处 的 周期 。 

4) ”服务 其 他 政府 部 门 ， 提 升 执 法 效率 

征 信 机 构 在 信息 采集 中 除了 采集 银行 信贷 信息 外 ， 还 依据 各 国政 府 的 政府 信息 公开 的 
法 规 采集 了 大 量 的 非 银行 信息 ， 用 于 帮助 授信 机 构 的 风险 防范 。 在 这 种 情况 下 ， 当 政府 部 
门 由 于 执法 需要 征 信 机 构 提供 帮助 时 ， 可 以 依法 查询 征 信 机 构 的 数据 库 ， 或 要 求 征 信 机 构 
提供 相应 的 数据 。 

通过 征 信 活 动 ， 使 政府 在 依法 行政 过 程 中 存在 的 信息 不 对 称 问 题 得 到 有 效 解 决 ， 为 政 
府 部 门 决策 提供 了 重要 的 依据 ， 这 些 依据 主要 是 通过 第 三 方 反映 出 来 的 ， 信 息 的 准确 性 比 
较 强 ， 有 效 地 提高 了 执法 效率 。 

5) ”有 效 揭示 风险 ， 为 市 场 参与 各 方 提供 决策 依据 

征 信 机 构 不 仅 通 过 信用 报告 实现 信息 共享 ， 而 且 ， 会 在 这 些 客观 数据 的 基础 上 通过 加 
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工 而 推出 对 企业 和 个 人 的 综合 评价 ， 如 信用 评分 等 。 通 过 这 些 评 价 ， 可 以 有 效 反映 企业 和 
个 人 的 实际 风险 水 平 ， 有 效 降低 授信 市 场 参与 各 方 的 信息 不 对 称 ， 从 而 得 到 市 场 的 广泛 认 
可 ， 并 帮助 各 方 做 出 更 好 的 决策 。 

这 些 综合 评价 主要 有 两 个 作用 : 第 一 是 信号 传递 作用 。 通 过 这 些 综合 评价 ， 将 新 信息 
或 现 有 的 信息 加 以 综合 ， 提 供给 市 场 ， 市 场 根据 这 些 综合 评价 所 处 的 信用 区 间 ， 对 受信 方 
的 信用 状况 做 出 一 个 整体 的 评价 。 第 二 是 证 明 作 用 。 满 足 一 定 门槛 的 信用 评分 ， 往 往 成 为 
监管 者 规定 取得 授信 的 条 件 之 一 。 

6) ”提高 社会 信用 意识 ， 维 护 社会 稳定 

在 现代 市 场 经 济 中 ， 培 养 企业 和 个 人 具有 良好 的 社会 信用 意识 ， 有 利于 提升 宏观 经 济 
运行 效率 。 但 是 ， 良 好 的 社会 信用 意识 并 不 是 仅仅 依靠 教育 和 道德 的 约束 就 能 够 建立 的 ， 
必须 在 制度 建设 上 有 完备 的 约束 机 制 。 以 美国 为 例 ， 美 国 国民 的 社会 信用 意识 和 遵 纪 守 法 
意识 比较 强 ， 主 要 是 靠 完 善 的 制度 约束 达 致 的 ， 当 制度 约束 缺失 时 ， 国 民 的 社会 信用 意识 
和 遵 纪 守 法 意识 也 会 面临 严峻 的 挑战 。 

征 信 在 维护 社会 稳定 方面 也 发 挥 着 重要 的 作用 。 实 践 经 验 表 明 ， 不 少 企业 和 个 人 具有 
过 度 负债 的 冲动 ， 如 果 不 加 约束 ， 可 能 会 造成 企业 和 个 人 债务 负担 过 重 ， 影 响 企 业 和 个 人 
的 正常 经 营 和 活动 ， 甚 至 引发 社会 问题 。 有 的 国家 就 曾 发 生 过 信用 卡 过 度 发 展 ， 几 乎 酿 成 
全 民 债 务 危机 。 一 些 西方 国家 建立 公共 征 信 机 构 的 目的 之 一 就 是 防止 企业 、 个 人 过 度 负 
债 ， 维 护 社会 稳定 。 在 我 国 ， 征 信 活 动 有 助 于 金融 机 构 全 面 了 解 企 业 和 个 人 的 整体 负债 状 
况 ， 从 制度 上 防止 企业 和 个 人 过 度 负 债 ， 有 助 于 政府 部 门 及 时 了 解 社会 的 信用 状况 变动 ， 
防范 突 发 事件 对 国计民生 造成 重大 影响 ， 维 护 社会 稳定 。 

综 上 所 述 ， 正 是 因为 征 信 能 够 帮助 实现 信息 共享 ， 提 高 对 交易 对 手 风 险 的 识别 ， 所 
以 ， 征 信 在 经 济 和 金融 活动 中 具有 重要 的 地 位 ， 构 成 了 现代 金融 体系 运行 的 基石 ， 是 金融 
稳定 的 基础 ， 对 于 建设 良好 的 社会 信用 环境 具有 非常 深远 的 意义 。 


7.1.2 征 信 的 基本 流程 


征 信 活 动 可 以 分 为 两 类 : 一 类 是 征 信 机 构 主动 去 调查 被 征 信人 的 信用 状况 ， 另 一 类 是 
依靠 授信 机 构 或 其 他 机 构 批量 报 送 被 征 信 人 的 信用 状况 。 两 者 最 大 的 区 别 在 于 前 者 往往 是 
一 种 个 体 活动 ， 通 过 接受 客户 的 委托 ， 亲 自 到 一 线 去 收集 调查 客户 的 信用 状况 ， 后 者 往往 
是 商业 银行 等 授信 机 构 组 织 起 来 ， 将 信息 定期 报 给 征 信 机 构 ， 从 而 建立 信息 共享 机 制 。 两 
者 还 有 一 个 区 别 是 前 者 评价 的 范围 更 广 ， 把 被 征 信人 的 资质 情况 、 诚 信 度 考察 、 资 产 状 况 
等 都 包括 在 内 ， 而 后 者 由 于 是 批量 采集 信息 ， 因 此 灵活 性 和 主观 性 上 不 如 前 者 ， 但 规律 性 
和 客观 性 则 强 于 前 者 。 但 两 类 方式 在 征 信 的 基本 流程 上 是 相同 的 ， 例 如 ， 前 一 类 流程 要 制 
订 计 划 ， 决 定 采集 哪些 信息 ， 而 后 一 类 流程 也 同样 如 此 ， 由 征 信 机 构 事先 确定 好 需要 采集 
的 信息 后 ， 与 信息 拥有 方 协商 ， 达 成 协议 或 其 他 形式 的 约定 ， 定 期 向 征 信 机 构 批量 报 送 数 
据 ， 因 此 ， 在 讨论 流程 时 ， 可 以 将 两 者 合并 在 一 起 ， 如 图 7.2 所 示 。 
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解 到 的 信息 人 


7.2 “ 征 信 数据 库 形成 流程 

1. 制订 数据 采集 计划 

能 够 反映 被 征 信 人 信用 状况 的 信息 范围 广泛 ， 为 提高 效率 、 节 省 成 本 ， 征 信 机 构 应 事 
先 制订 数据 采集 计划 ， 做 到 有 的 放 矢 。 这 是 征 信 基本 流程 中 一 个 重要 的 环节 ， 一 份 好 的 计 
划 能 够 有 效 减轻 后 面 环 节 的 工作 负担 。 一 般 来 说 ， 数 据 采 集 计 划 包 括 以 下 内 容 。 

1) ”采集 数据 项 

客户 使 用 征 信 产品 的 目的 都 不 尽 相 同 ， 有 的 希望 了 解 被 征 信 人 短期 的 信用 状况 ， 有 的 
则 是 作为 中 长 期 商业 决策 的 参考 。 客 户 的 不 同 需求 决定 了 数据 采集 重点 的 连 异 。 征 信 机 构 
要 本 着 重点 突出 、 不 重 不 漏 的 原则 ， 从 客户 的 实际 需求 出 发 ， 进 而 确定 所 需 采 集 数 据 的 种 
类 。 例 如 ，A 银 行 决定 是 否 对 B 企业 发 放 一 笔 短期 贷款 时 ， 应 重点 关注 该 企业 的 历史 信贷 
记录 、 资 金 周转 情况 ， 需 采集 的 数据 项 为 企业 基本 概况 、 历 史 信贷 记录 、 财 务 状况 等 。 

2) ”采集 方式 

确定 科学 合理 的 采集 方式 是 采集 计划 的 另 一 主要 内 容 。 不 论 主动 调查 ， 还 是 授信 机 构 
或 其 他 机 构 批量 报 送 数据 ， 征 信 机 构 都 应 制定 最 经 济 便捷 的 采集 方式 ， 做 好 时 间 、 空 间 各 
项 准备 工作 。 对 于 批量 报 送 数据 的 方式 ， 由 于 所 提供 的 数据 项 种 类 多 、 信 息 量 大 ， 征 信 机 
构 应 事先 制订 一 个 规范 的 数据 报 送 格式 ， 让 授信 机 构 或 其 他 机 构 按照 格式 报 送 数据 。 

3) ”其 他 事项 

在 实际 征 信 过 程 中 ， 如 果 存 在 各 种 特殊 情况 或 发 生 突 发 状况 ， 征 信 机 构 应 在 数据 采集 
计划 中 加 以 说 明 ， 以 便 顺利 开展 下 面 的 工作 。 
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2. 采集 数据 


数据 采集 计划 完成 后 ， 征 信 机 构 应 依照 计划 开展 采集 数据 工作 。 数 据 一 般 来 源 于 已 公 
开 信息 、 征 信 机 构 内 部 存档 资料 、 授 信 机 构 等 专业 机 构 提 供 的 信息 、 被 征 信人 主动 提供 的 
信息 、 征 信 机 构 正 面 或 侧面 了 解 到 的 信息 。 出 于 采集 数据 真实 性 和 全 面 性 的 考虑 ， 征 信 机 
构 可 通过 多 种 途径 采集 信息 。 但 要 注意 ， 这 并 不 意味 着 数据 是 越 多 越 好 ， 要 兼顾 数据 的 可 
用 性 和 规模 ， 在 适度 的 范围 内 采集 合适 的 数据 。 


3. 数据 分 析 


征 信 机 构 收集 到 的 原始 数据 ， 只 有 经 过 一 系列 科学 分 析 之 后 ， 才 能 成 为 具有 参考 价值 
的 征 信 数据 。 

1) ”数据 查证 

数据 查证 是 保证 征 信 产 品 真实 性 的 关键 步骤 。 一 查 数据 的 真实 性 。 对 于 存疑 的 数据 ， 
征 信 机 构 可 以 通过 比较 不 同 采集 渠道 的 数据 ， 来 确认 正确 的 数据 。 当 数据 来 源 唯 一 时 ， 可 
通过 二 次 调查 或 实地 调查 ， 进 一 步 确 定数 据 的 真实 性 。 二 查 数据 来 源 的 可 信 度 。 某 些 被 征 
信人 为 达到 不 正当 目的 ， 可 能 向 征 信 机 构 提供 虚假 的 信息 。 如 果 发 现 这 种 情况 ， 征 信 机 构 
除 及 时 修改 数据 外 ， 还 应 记录 该 被 征 信人 的 “不 诚信 行为 ”， 作 为 以 后 业务 的 参考 依据 。 
三 查 缺 失 的 数据 。 如 果 发 现 采集 信息 不 完整 ， 征 信 机 构 可 以 依据 其 他 信息 进行 合理 推断 ， 
从 而 将 缺失 部 分 补充 完整 。 比 如 ， 利 用 某 企 业 连 续 几 年 的 财务 报表 推算 出 某 几 个 数据 缺失 
项 。 最 后 是 被 征 信 人 自 查 ， 即 异议 处 理 程 序 。 当 被 征 信 人 发 现 自己 的 信用 信息 有 误 时 ， 可 
向 征 信 机 构 提 出 申请 ， 修 正 错 误 的 信息 或 添加 异议 声明 。 特 别 是 批量 报 送 数据 时 ， 征 信 机 
构 无 法 对 数据 进行 一 一 查证 ， 一 般 常用 异议 处 理 方式 。 

2) “信用 评分 

信用 评分 是 个 人 征 信 活 动 中 最 核心 的 数据 分 析 手 段 ， 它 运用 先进 的 数据 挖掘 技术 和 统 
计 分 析 方法 ， 通 过 对 个 人 的 基本 概况 、 信 用 历史 记录 、 行 为 记录 、 交 易 记 录 等 大 量 数据 进 
行 系统 的 分 析 ， 挖 掘 数 据 中 蕴含 的 行为 模式 和 信用 特征 ， 捕 捉 历 史 信息 和 未 来 信息 表现 之 
间 的 关系 ， 以 信用 评分 的 形式 对 个 人 未 来 的 某 种 信用 表现 做 出 综合 评估 。 信 用 评分 模型 有 
各 种 类 型 ， 能 够 预测 未 来 不 同 的 信用 表现 。 常 见 的 有 信用 局 风险 评分 、 信 用 局 破产 评分 、 
征 信和 局 收益 评分 、 申 请 风险 评分 、 交 易 欺 诈 评 分 、 申 请 欺诈 评分 等 。 

3) ”其 他 数据 分 析 方 法 

在 对 征 信 数据 进行 分 析 时 ， 还 有 许多 其 他 的 方法 ， 主 要 是 借助 统计 分 析 方 法 对 征 信 数 
据 进行 全 方位 分 析 ， 并 将 分 析 获 得 的 综合 信息 用 于 不 同 的 目的 ， 如 市 场 营销 、 决 策 支 持 、 
宏观 分 析 、 行 业 分 析 等 领域 。 使 用 的 统计 方法 主要 有 关联 分 析 、 分 类 分 析 、 预 测 分 析 、 时 
间 序 列 分 析 、 神 经 网 络 分 析 等 。 

4. 形成 信用 报告 

征 信 机 构 完成 数据 采集 后 ， 根 据 收集 到 的 数据 和 分 析 结 果 ， 加 以 综合 整理 ， 最 终 形成 
信用 报告 。 信 用 报告 是 征 信 机 构 前 期 工作 的 智慧 结晶 ， 体 现 了 征 信 机 构 的 业务 水 平 ， 同 时 
也 是 客户 了 解 被 征 信 人 信用 状况 、 制 定 商业 决策 的 重要 参考 。 因 此 ， 征 信 机 构 在 生成 信用 
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告 时 ， 务 必要 贯彻 客观 性 、 全 面 性 、 隐 私 和 商业 秘密 保护 的 科学 原则 。 所 谓 客观 性 ， 指 
的 是 信用 报告 的 内 容 完 全 是 真实 客观 的 ， 没 有 掺 杂 征 信 机 构 的 任何 主观 判断 。 基 于 全 面 性 
原则 ， 征 信 报 告 应 充分 披露 任何 能 够 体现 被 征 信人 信用 状况 的 信息 。 但 这 并 不 等 于 长 篇 大 
论 ， 一 份 高 质量 的 信用 报告 言 简 意 赎 、 重 点 突出 ， 使 客户 能 够 一 目 了 然 。 征 信 机 构 在 撰写 
信用 报告 过 程 中 ， 一 定 要 严格 遵守 隐私 和 商业 秘密 保护 原则 ， 避 免 泄露 相关 信息 ， 致 使 客 
户 和 被 征 信人 权益 受到 损害 。 信 用 报告 是 征 信 机 构 最 基本 的 终端 产品 。 随 着 征 信 技 术 的 不 
断 发 展 ， 征 信 机 构 在 信用 报告 的 基础 上 衍生 出 越 来 越 多 的 征 信 增值 产品 ， 如 信用 评分 等 。 
不 论 形式 如 何 变化 ， 这 些 基 本 原则 是 始终 不 变 的 。 


7.1.3 ” 征 信行 业 产 业 链 


征 信 行业 产业 链 包括 上 游 的 数据 生产 者 、 中 游 的 征 信 机 构 及 下 游 的 征 信 信息 使 用 者 ， 
其 中 中 游 的 征 信 机 构 运 行 模式 主要 有 采集 数据 、 加 工 数据 及 销售 产品 。 征 信行 业 产 业 链 如 
图 7.3 所 示 。 


应 用 场景 


征 信 公 司 的 核心 竞争 力 Th 


“银行 等 金融 ”数据 服务 i 
机 要 采集 , 一 
和 
-和 人 “个 人 征 人 机 构 。 提 信 骤 务 反馈 商务 放 由 
人 i 
:和 人 
1 数据 回流 | 


7.3 “” 征 信 行业 产业 链 划 分 


按照 数据 生产 者 划分 ， 可 以 分 为 个 人 征 信和 企业 征 信 。 个 人 征 信 的 数据 生产 者 是 个 
人 ， 征 信 机 构 采集 个 人 产生 的 数据 ， 加 工 并 销售 信用 产品 ， 而 企业 征 信 的 数据 生产 者 是 企 
业 ( 工 商 企业 、 政 府 、 金 融 机 构 或 是 小 微 企业 等 )， 征 信 机 构 采集 企业 生产 的 数据 ， 加 工 及 
销售 信用 产品 。 


7.1.4 征 信 产品 


1. 企业 征 信 产 品 


经 过 多 年 的 探索 和 发 展 ， 企 业 征 信 系 统 的 产品 和 服务 体系 日 益 完备 ， 以 各 种 版 本 信用 
报告 为 核心 的 基础 产品 体系 已 经 相对 成 熟 ， 以 关联 查询 服务 、 企 业 征 信 汇 总 数据 为 代表 的 
增值 服务 体系 初步 形成 。 

1) ”基础 产品 

企业 信用 报告 是 企业 征 信 系 统 提供 的 基础 产品 。 随 着 征 信 系 统 应 用 的 推广 与 深入 ， 信 
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大 数据 征 信 及 


用 报告 已 成 为 商业 银行 信用 风险 管理 的 重要 工具 ， 服 务 于 银行 信贷 流程 中 的 贷 前 审查 、 贷 
后 管理 、 资 产 保全 等 各 个 环节 。 
改进 企业 信用 报告 版 本 。2005 年 ， 征 信 中 心 首次 推出 企业 信用 报告 时 ， 仅 有 一 个 版 
本 。 为 更 好 地 服务 不 同类 别 的 用 户 ， 征 信 中 心 不 断 优化 信用 报告 内 容 、 丰 富 信用 报告 版 
本 。 新 版 企业 信用 报告 于 2013 年 正式 推出 。 
新 版 企业 信用 报告 针对 不 同 的 需求 主体 分 为 4 个 版 本 : 一 是 为 以 银行 为 代表 的 授信 机 
构 服 务 的 银行 版 ; 二 是 为 政府 部 门 履 职 使 用 的 政府 版 ;， 三 是 为 其 他 机 构 服务 的 社会 版 ; 四 
是 为 满足 信息 主体 查询 需求 的 自主 查询 版 。 新 版 信用 报告 内 容 更 加 丰富 、 完 整 ， 结构 层次 
更 分 明 ， 信 息 展示 顺序 更 加 符合 阅读 习惯 ， 展 示 方 式 更 加 灵活 ， 可 读 性 更 强 。 
企业 信用 报告 的 主要 内 容 包括 报 告 头 、 基 本 信息 、 有 直接 关联 关系 的 其 他 企业 、 财 务 
报表 、 信 息 概要 、 信 贷 记 录 明 细 、 公 共 记 录 明 细 、 声 明 信 息 明细 等 。 不 同 版 本 的 企业 信用 
报告 ， 内 容 各 有 侧重 。 新 版 企业 信用 报告 的 基本 内 容 如 图 7.4 所 示 。 
| | 银行 版 ”| ”政府 版 ”| ”社会 版 ”| 自主 查询 版 | 
| “报告 头 “” 国 国 : ~ Y ~ 
| 报告 说 明 | 
| ”基本 信息 | 
的 其 他 企业 


息 
| 财务 报表 | 
5 纪 
乡 
EE 


| 信息 概要 | 
信贷 记录 明细 
| 公共 记录 明细 


声明 信息 明细 


人 
人 让 山 同 出 和 和 
< tH 二 国 
< Ee < We MH Be 2 


7.4 ”新 版 企业 信用 报告 的 基本 内 容 


目前 ， 根 据 服务 对 象 和 使 用 目的 的 不 同 ， 各 类 用 户 可 以 通过 页 面 方式 和 接口 方式 查询 
企业 信用 报告 。 

2) ”增值 产品 

征 信 中 心 对 所 采集 的 各 类 企业 信息 进行 深加工 ， 针 对 用 户 的 个 性 化 需求 ， 先 后 推出 了 
关联 企业 查询 、 企 业 征 信 汇 总 数据 、 对 公 业 务 重 要 信息 提示 、 征 信 系 统 信贷 资产 结构 分 
析 、 历 史 违约 率 等 增值 产品 。 

(1) 关联 企业 查询 。 

关联 企业 查询 产品 是 基于 企业 征 信 系 统 借款 人 基本 信息 和 信贷 信息 ， 通 过 数据 挖掘 找 
出 借款 人 与 企业 、 借 款 人 与 个 人 存在 的 直接 或 间接 或 共同 控制 的 经 济 关 系 ， 包 括 以 资本 为 
纽带 和 以 经 济 利益 为 纽带 的 33 种 关系 。 

目前 ， 征 信 中 心 主要 提供 3 类 关联 企业 查询 产品 : 一 是 关联 企业 名 单 及 关系 表 ; 二 是 
关联 企业 群 信贷 业务 及 被 起 诉 信息 汇总 表 ; 三 是 关联 企业 群 的 贷款 业务 集中 还 款 时 间 统 
计 表 。 

早 在 2002 年 ， 银 行 信贷 登记 咨询 系统 就 开始 提供 这 项 服务 。 企 业 征 信 系 统 上 线 以 
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后 ， 经 过 多 轮 改造 ， 关 联 关系 达到 9 大 类 33 种 ;提供 方式 由 标准 化 转 为 个 性 化 ， 查 询 方 
式 在 单个 查询 基础 上 增加 了 批量 查询 ;服务 模式 由 来 函 申请 查询 转 为 在 线 查询 ; 产品 由 标 
准 化 转 为 自 定义 ; 服务 对 象 由 单一 自身 使 用 扩大 到 10 个 政府 部 门 、 各 省 人 民 银 行 分 支行 
和 银 监 局 、21 家 全 国 性 商业 银行 和 580 多 家 地 方 性 金融 机 构 ， 应 用 面 由 单一 集团 客户 信贷 
管理 ， 扩 大 到 小 微 企业 信 贷 管理 。 

(2) 企业 征 信 汇总 数据 。 

该 产品 是 利用 企业 征 信 系统 的 数据 ， 以 金融 统计 核算 原则 为 基础 ， 通 过 对 数据 的 加 
工 、 整 理 ， 建 立 银行 业 信贷 业务 报表 体系 和 指标 体系 ， 综 合 反 映 银行 业 信 贷 业 务 的 运行 特 
征 和 状况 ， 从 而 为 货币 政策 制定 、 金 融 监 管 和 商业 银行 经 营 管理 提供 全 面 、 及 时 、 准 确 的 
信息 。 其 服务 对 象 主要 是 人 民 银 行 各 级 分 支 机 构 。 

2007 一 2011 年 ， 主 要 以 来 函 申请 的 方式 提供 查询 。2011 年 ， 征 信 中 心 建成 征 信 数据 
应 用 分 析 系 统 ， 实 现在 线 查 询 ， 服 务 效率 提高 。 此 后 ， 随 着 该 系统 业务 处 理 流程 的 优化 ， 
服务 时 效 性 进一步 增强 。 

企业 征 信 汇总 数据 主要 包括 信贷 结构 类 汇总 数据 和 信贷 特征 类 汇总 数据 两 类 。 前 者 于 
2007 年 10 月 正式 投产 使 用 ， 目 前 按 月 向 各 征 信 分 中 心 提供 辖 内 信贷 汇总 数据 ， 也 为 人 民 
银行 及 其 分 支 机 构 的 个 性 化 需求 提供 服务 。 后 者 于 2011 年 12 月 正式 上 线 ， 主 要 服务 于 各 
人 民 银 行 分 支 机 构 ， 用 于 为 本 辖区 的 货币 政策 执行 和 金融 风险 监控 提供 信息 参考 。 

(3) 对 公 业 务 重要 信息 提示 。 

该 产品 是 利用 企业 征 信 系统 即时 更 新 的 数据 ， 每 工作 日 将 各 机 构 用 户 的 本 机 构 “ 好 客 
户 ” 在 其 他 机 构 发 生 “ 新 增 逾 期 90 天 /60 天 ”、 五 级 分 类 “新 增 不 良 ”“ 新 增 失 信 被 执行 
人 ”等 提示 信息 主动 推送 给 相关 机 构 用 户 总 部 。 

(4) 征 信 系统 信贷 资产 结构 分 析 。 

该 产品 是 运用 征 信 系统 的 数据 ， 以 图 形 的 形式 反映 单 家 机 构 在 信贷 市 场 中 的 相对 位 置 
以 及 市 场 份额 ， 为 商业 银行 信贷 决策 提供 信息 支持 。 该 产品 指标 设计 以 行业 、 地 区 为 主 
线 ， 以 贷款 、 贸 易 融 资 、 票 据 贴现 、 保 理 、 信 用 证 、 银 行 承兑 汇票 、 保 函 等 7 项 业务 为 畏 
线 ， 提 供 分 地 区 、 分 行业 、 分 信贷 品种 的 信贷 市 场 运行 分 析 、 信 贷 市 场 结构 分 析 、 信 贷 资 
产 质量 分 析 。 每 类 指标 既 提 供 时 点 (或 时 段 ) 值 ， 又 提供 时 间 序 列 值 ， 均 以 图 形 的 形式 
展示 。 

(5) 历史 违约 率 。 

该 产品 利用 征 信 系统 覆盖 全 市 场 的 数据 计算 出 某 一 时 点 上 的 正常 客户 ， 之 后 1 年 在 全 
市 场 上 发 生 违约 的 比率 。 该 产品 包括 客户 在 本 银行 和 他 银行 的 违约 ， 反 映 银行 业 对 公 业 务 
中 借款 人 平均 违约 水 平 ， 可 作为 行业 中 衡量 这 一 群体 实际 违约 水 平 的 标准 ， 直 接 用 于 校准 
商业 银行 使 用 本 银行 数据 计算 的 历史 违约 比率 ， 提 高 测算 违约 概率 的 精准 度 ， 为 商业 银行 
配置 信贷 资产 组 合 和 定价 、 制 订 信贷 方案 提供 数据 支持 。 

历史 违约 率 产 品 分 两 大 类 : 一 是 银行 业 所 有 客户 的 违约 率 ; 二 是 本 机 构 客户 在 银行 业 
发 生 信贷 业务 的 违约 率 。 该 产品 按 月 加 工 ， 向 用 户 提供 分 行业 、 地 区 (借款 人 注册 地 和 金融 
机 构 所 在 地 )、 借 款 人 规模 、 金 融 机 构 (全 金融 机 构 和 本 机 构 )、 信 贷 业 务 种 类 、 违 约 标准 6 
个 查询 条 件 。 查 询 结果 包括 期 初 正常 客户 数 、 观 察 期 违约 客户 数 、 违 约 率 值 。 
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2. 个 人 征 信 产 品 

经 过 10 年 的 积极 探索 和 经 验 积累 ， 个 人 征 信 系 统 已 形成 以 个 人 信用 报告 、 个 人 信用 
信息 提示 和 个 人 信用 信息 概要 为 核心 的 基础 产品 体系 ， 以 个 人 业务 重要 信息 提示 和 个 人 信 
用 报告 数字 解读 为 代表 的 增值 产品 体系 。 

1) “基础 产品 

个 人 征 信 系 统 提 供 的 基础 产品 主要 有 个 人 信用 报告 、 个 人 信用 信息 提示 和 个 人 信用 信 
息 概 要 3 种 。 

(1) 个 人 信用 报告 。 

个 人 信用 报告 是 个 人 征 信 系 统 提供 的 核心 基础 产品 。 多 年 来 ， 征 信 中 心 通过 不 断 优化 
个 人 信用 报告 内 容 、 丰 富 信用 报告 版 本 、 完 善信 用 报告 版 式 设计 等 方式 ， 促 进 个 人 信用 报 
告 更 好 的 应 用 。 

目前 ， 个 人 信用 报告 根据 服务 对 象 及 使 用 目的 不 同 ， 分 为 4 个 版 本 : 为 以 银行 为 代表 
的 授信 机 构 服 务 的 银行 版 ， 含 配套 的 仅 包含 本 行 报 送信 息 的 银行 异议 版 ， 满足 消费 者 本 人 
查询 需求 的 个 人 版 ( 含 彩色 样式 ) 以 及 个 人 明细 版 (彩色 样式 );， 为 其 他 社会 主体 服务 的 社会 
版 ， 供 征 信 系统 管理 使 用 的 征 信 中 心 版 。 个 人 信用 报告 的 基本 内 容 包 括 : 报告 头 、 个 人 基 
本 信息 、 信 贷 交 易 信息 、 公 共 人 信息、 声明 信 息 、 查 询 记 录 和 报告 说 明 。 不 同 版 本 的 信用 报 
告 对 上 述 内 容 各 有 侧重 。 新 版 个 人 信用 报告 的 主要 内 容 如 图 7.5 所 示 。 
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屏蔽 他 行 的 仅 包 含 本 机 基本 信息 
人 构 报 送 的 信 人 
务 号 。 贷 信息 姻 状 


7.5 ”新 版 个 人 信用 报告 的 主要 内 容 


(2) 个 人 信用 信息 提示 。 

信用 信息 提示 是 用 来 提示 个 人 信息 主体 在 个 人 征 信 系统 中 是 否 存在 最 近 5 年 的 逾期 记 
录 ， 通 过 互联 网 个 人 信用 信息 服务 平台 和 短信 方式 向 个 人 信息 主体 提供 查询 服务 。 

(3) 个 人 信用 信息 概要 。 

个 人 信用 信息 概要 主要 包括 信贷 记录 、 公 共 记 录 和 最 近 2 年 内 查询 记录 的 汇总 统计 信 
息 ， 便 于 消费 者 快速 了 解 自身 的 信用 概况 ， 通 过 互联 网 个 人 信用 信息 服务 平台 向 信息 主体 
提供 查询 服务 。 

2) ”增值 产品 

(1) 个 人 业务 重要 信息 提示 。 

个 人 业务 重要 信息 提示 是 利用 个 人 征 信 系 统 即 时 更 新 的 数据 ， 按 周 将 各 机 构 用 户 的 本 
机 构 “ 好 客户 ”在 其 他 机 构 发 生 “ 新 增 逾 期 61 一 90 天 /90 天 以 上 ”、 贷 款 五 级 分 类 “新 增 
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不 良 ”、 信 用 卡 账 户 状 态 “新 增 呆 账 ”、 贷 款 或 信用 卡 “ 新 增 账户 ”。 

“新 增 失 信 被 执行 人 ”等 提示 信息 主动 推送 给 相关 机 构 用 户 总 部 。 信 息 提示 方式 包括 
展示 和 下 载 、 接 口 主动 推送 、 邮 件 主动 推送 3 种 ， 用 户 可 自行 选择 使 用 。 
需要 引起 注意 的 是 ， 个 人 业务 重要 信息 提示 不 同 于 个 人 信用 信息 提示 。 两 者 的 主要 区 
别 是 : 个 人 业务 重要 信息 提示 是 面向 授信 机 构 用 户 提供 的 服务 ， 而 个 人 信用 信息 提示 是 面 
向 个 人 信息 主体 提供 的 服务 。 

(2) 个 人 信用 报告 数字 解读 。 

个 人 信用 报告 数字 解读 (以 下 简称 “数字 解读 ”) 是 在 征 信 中 心 与 美国 费 埃 哲 公 司 (Fair 
Isaac Corporation) 合 作 进行 个 人 征 信 评分 研究 项 目的 基础 上 ， 利 用 个 人 征 信和 系统 的 信贷 数 
据 ， 使 用 统计 建 模 技 术 开 发 出 来 的 个 人 信用 风险 量化 服务 工具 ， 用 于 预测 放贷 机 构 个 人 客 
户 在 未 来 一 段 时 间 内 发 生 信贷 违约 的 可 能 性 ， 并 以 “数字 解读 ” 值 的 形式 展示 。 

“数字 解读 ”的 分 数 范围 为 0 一 1000 分 ， 每 个 分 数 对 应 一 定 的 违约 率 。 分 值 越 高 ， 表 
示 未 来 发 生 信贷 违约 的 可 能 性 越 低 ， 其 信用 风险 越 小 ， 分 值 越 低 ， 表 示 未 来 发 生 信贷 违约 
的 可 能 性 越 高 ， 其 信用 风险 越 大 。 一 般 情况 下 ， 高 分 人 群 整体 的 信用 状况 优 于 低 分 人 群 ， 
即 未 来 发 生 信 贷 违 约 的 可 能 性 较 低 。“ 数 字 解 读 ” 旨 在 帮助 放贷 机 构 更 加 便捷 地 使 用 信用 
报告 信息 ， 了 解 客户 的 信贷 风险 状况 及 未 来 发 生 信贷 违约 的 可 能 性 。 


7.1.5 征 信 机 构 


征 信 机 构 是 负责 管理 信用 信息 共享 的 机 构 ， 从 事 个 人 和 (或 ) 企 业 信用 信息 的 采集 、 加 
工 处 理 ， 并 为 用 户 提供 信用 报告 和 其 他 基于 征 信 系统 数据 的 增值 产品 。 

从 全 球 实践 来 看 ， 征 信 机 构 一 般 分 为 3 类 : 个 人 征 信 机 构 (credit bureau)、 信 贷 登记 系 
统 (credit registry) 和 企业 征 信 机 构 (commercial credit reporting company)，3 类 机 构 的 经 营 模 
式 和 目标 服务 市 场 各 有 差异 。 


1. 个 人 征 信 机 构 


个 人 征 信 机 构 (credit bureau) 通 常 是 私营 的 ， 是 按照 现代 企业 制度 建立 、 完 全 市 场 化 运 
作 的 征 信 机 构 ， 主 要 为 商业 银行 、 保 险 公 司 、 贸 易 、 邮 购 公司 等 信息 使 用 者 提供 服务 。 美 
国 是 典型 的 私营 征 信 机 构 模 式 ， 商 业 化 征 信 机 构 拥有 全 面 的 信用 信息 系统 。 
个 人 征 信 机 构 主要 为 信贷 机 构 提 供 个 人 借款 人 以 及 微型 、 中 小 型 企业 的 信用 信息 。 它 
们 从 银行 、 信 用 卡 发 行 机 构 和 其 他 非 银行 金融 机 构 等 各 类 信贷 机 构 采 集 标准 化 的 信息 ， 同 
时 还 采集 各 类 公共 信息 ， 如 法 院 判 决 、 破 产 信息 、 电 话 短信 息 ， 或 担保 物 权 登 记 系 统 等 第 
三 方 数据 库 的 信息 。 此 外 ， 它 们 也 会 采集 一 些 非 传 统 信用 数据 ， 如 零售 商 对 消费 者 的 肉 销 
信息 ， 以 及 煤气 、 水 、 电 等 公共 事业 缴费 信息 ， 有 线 电视 、 电 话 、 网 络 等 其 他 先 使 用 服务 
后 付费 服务 的 缴费 数据 ， 以 便 提 供 更 好 、 更 完善 的 信用 报告 。 对 从 未 与 银行 发 生 过 信贷 关 
系 的 个 人 以 及 微型 、 中 小 型 企业 而 言 ， 不 断 拓宽 信息 来 源 非常 有 益 ， 可 以 帮助 它们 在 没有 
银行 信贷 记录 的 情况 下 建立 起 信用 档案 ， 从 而 有 效 解决 因为 没有 信用 档案 而 无 法 获得 银行 
贷款 的 难题 。 

一 直 以 来 ， 个 人 征 信 机 构 主要 采集 个 人 信息 。 近 年 来 ， 随 着 微型 以 及 中 小 企业 信贷 业 


页 


216 


大 数据 征 信 记 第 友 齐 


务 的 发 展 、 信 息 技术 的 进步 ， 越 来 越 多 的 个 人 征 信 机 构 开 始 采集 微型 以 及 中 小 企业 的 信用 
信息 ， 并 提供 其 信用 报告 。 根 据 世界 银行 《2012 全 球 营 商 环境 报告 》 对 全 球 100 家 个 人 征 
信 机 构 的 调查 ， 超 过 80% 或 多 或 少 都 采集 企业 信息 。 这 样 做 的 好 处 是 可 以 把 对 企业 与 业主 
的 信用 评估 结合 起 来 ， 因 为 微型 和 中 小 企业 的 业主 经 常 把 个 人 财务 和 企业 财务 混在 一 起 ， 
所 以 企业 业主 的 信用 记录 是 评估 小 企业 信用 风险 的 重要 参考 因素 。 

个 人 征 信 机 构 通常 采取 数据 提供 者 自愿 报 数 (通过 签署 数据 共享 互惠 协议 ) 的 模式 ， 广 
泛 采集 各 类 信用 数据 ， 并 提供 多 样 化 的 征 信 产品 和 服务 ， 帮 助 信 贷 机 构 做 出 信贷 决策 。 在 
一 些 国家 和 地 区 ， 通 常 是 在 征 信 业 的 发 展 初期 ， 法 律 会 强制 要 求 有 关 各 方 进行 数据 共享 ， 
并 使 用 征 信 机 构 的 服务 。 此 外 ， 还 会 赋予 监 管 机 构 相 应 的 权利 ， 以 督促 信贷 机 构 加 入 征 信 
系统 并 监控 其 加 入 情况 。 


2. 信贷 登记 系统 


信贷 登记 系统 起 源 于 欧洲 。 从 历史 上 看 ， 信 贷 登 记 系统 (credit registry) 的 建立 目的 与 个 
人 征 信 机 构 不 同 。 大 多 数 信贷 登记 系统 最 初 是 作为 中 央 银 行 的 内 部 数据 库 而 设立 的 ， 而 且 
目前 仍然 有 很 多 信贷 登记 系统 用 于 中 央 银 行 的 宏观 金融 监管 。 根 据 世 界 银行 的 调查 ， 越 来 
越 多 的 国家 政府 鼓励 成 立信 贷 登 记 系统 来 监督 商业 银行 的 信贷 活动 。 因 此 ， 这 些 数据 库 通 
常 采集 贷款 额度 在 一 定金 额 以 上 的 大 额 信贷 业务 数据 。 最 初 ， 信 贷 登 记 系 统 的 信息 仅 限于 
央行 内 部 使 用 。 但 随 着 时 间 的 推移 ， 信 贷 登 记 系统 也 开始 向 受 监管 的 信贷 机 构 提 供 信用 报 
告 。 而 且 ， 随 着 消费 信贷 的 发 展 ， 信 贷 登 记 系 统 普 遍 降低 或 取消 了 数据 采集 门槛 。 在 许多 
国家 ， 如 法 国 、 阿 根 廷 、 西 班 牙 、 秘 鲁 、 意 大 利 、 比 利 时 等 ， 信 贷 登 记 系统 已 经 开始 提供 
与 个 人 征 信 机 构 类 似 的 产品 和 服务 。 通 常 ， 法 律 要 求 所 有 受 监管 的 金融 机 构 都 要 向 信贷 登 
记 系 统 报 送 数据 。 

信贷 登记 系统 既 采 集 个 人 信息 ， 也 采集 企业 信息 。 个 人 信息 通常 包括 个 人 的 身份 验证 
信息 、 贷 款 类 型 和 贷款 特征 信息 、 负 面 信息 、 担 保 和 保证 类 信息 以 及 还 款 记录 信息 。 企 业 
信息 通常 包括 企业 的 身份 标识 信息 、 企 业主 的 信息 、 贷 款 类 型 和 贷款 特征 信息 、 负 面 信息 
和 还 款 记 录 。 

3. 企业 征 信 机 构 


企业 征 信 机 构 (commercial credit reporting company) 提 供 关 于 企业 的 信息 ， 这 些 企业 包 
含 个 人 独资 企业 、 合 伙 企 业 和 公司 制 企 业 ， 并 通过 公共 渠道 、 直 接 调 查 、 供 货 商 和 贸易 债 
权 人 提供 的 付款 历史 来 获取 信息 。 企 业 征 信 机 构 所 覆盖 的 企业 在 规模 和 经 营 收入 上 都 小 于 
信用 评级 机 构 所 覆盖 的 企业 ， 其 采集 的 信息 一 般 用 于 信用 风险 评估 或 信用 评分 ， 或 是 用 于 
贸易 信用 展期 等 其 他 用 途 。 

企业 征 信 机 构 与 个 人 征 信 机 构 的 差异 体现 在 以 下 几 个 方面 : 企业 征 信 机 构 采集 的 信息 
不 包括 个 人 敏感 信息 ， 所 覆盖 的 交易 的 规模 也 大 得 多 。 与 个 人 征 信 相 比 ， 企 业 征 信 往往 需 
要 采集 更 多 的 有 关 企 业 借款 人 的 支付 信息 和 财务 信息 。 为 了 保护 个 人 数据 主体 的 权利 ,个 
人 征 信和 机构 会 披露 数据 提供 者 的 身份 ， 但 企业 征 信 机 构 却 不 会 让 企业 数据 主体 知道 其 数据 
来 源 或 用 户 的 身份 。 

企业 征 信 机 构 也 可 能 会 采集 小 企业 的 信息 ， 但 由 于 其 报告 的 数据 项 并 不 适合 小 企业 ， 
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i 
所 以 采集 的 信息 往往 比较 有 限 。 正 如 前 面 提 到 的 ， 由 于 小 企业 往往 不 会 公开 自身 的 财务 信 
息 ， 所 以 其 企业 主 的 信用 记录 对 评估 小 企业 的 信用 情况 非常 有 用 。 但 企业 征 信 机 构 并 不 采 
集 个 人 数据 。 此 外 ， 由 于 微型 或 小 型 企业 的 信用 信息 采集 成 本 往往 较 高 。 因 此 ， 与 企业 征 
信 机 构 相 比 ， 个 人 征 信 机 构 往往 能 更 好 地 满足 对 微型 和 中 小 型 企业 的 征 信 需 求 。 
除 以 上 征 信 机 构 外 ， 现 实 中 ， 很 多 发 展 中 国家 的 征 信 机 构 以 欧洲 模式 为 基础 ， 在 发 展 
过 程 中 又 向 美国 模式 价 侍 ， 呈 现 出 混合 模式 的 特点 。 
国际 上 征 信 系统 的 建设 和 运行 越 来 越 呈现 出 多 元 化 特别 是 运行 市 场 化 的 特点 ， 很 难说 
某 个 征 信 机 构 是 公共 的 还 是 纯 商 业 性 的 。 机 构 的 性 质 不 只 是 两 个 极端 ， 即 便 政府 出 资 举办 
的 事业 或 投资 的 机 构 ， 很 多 也 是 在 不 同 程度 上 进行 市 场 化 运作 的 。 目 前 新 兴 市 场 经 济 国家 
尤其 是 亚洲 地 区 的 征 信 机 构 都 是 运用 市 场 的 力量 来 建设 和 运行 公共 征 信 系统 ， 针 对 为 金融 
机 构 和 社会 提供 的 服务 收费 ， 实 现 征 信 机 构 的 可 持续 发 展 。 


7.1.6 ” 征 信 体 系 


征 信 体系 是 指 与 征 信 活动 有 关 的 法 律 规章 、 组 织 机 构 、 市 场 管理 、 文 化 建设 、 宣 传教 
育 等 共同 构成 的 一 个 体系 。 

征 信 体系 的 主要 功能 是 为 信贷 市 场 服 务 ， 但 同时 具有 较 强 的 外 延性 ， 还 向 商品 交易 市 
场 和 劳动 力 市 场 提供 服务 。 在 实践 中 ， 征 信 体 系 的 主要 参与 者 有 征 信 机 构 、 金 融 机 构 、 企 
业 、 个 人 及 政府 。 社 会 信用 体系 是 市 场 经 济 发 展 的 必然 产物 。 在 信用 交易 成 为 市 场 交 易 的 
主要 方式 、 信 用 工具 被 大 规模 使 用 以 及 信用 风险 日 益 显著 的 背景 下 ， 社 会 信用 体系 成 为 影 
响 一 个 国家 经 济 发 展 的 重要 方面 。 经 过 上 百年 的 市 场 经 济 发 展 ， 发 达 国 家 形成 了 相对 比较 
完善 的 社会 信用 体系 。 但 是 ， 由 于 各 国 经 济 、 文 化 、 历 史 不 同 ， 不 同 国家 形成 了 不 同 的 社 
会 信用 体系 模式 。 


1. 国外 征 信 体 系 模式 
如 图 7.6 所 示 为 世界 征 信 体系 模式 的 种 类 。 


世界 征 信 体 系 模式 


! 征 信 机 构 以 营利 为 目的 ， 收 集 、 村 业 协 会 为 主 建 立信 用 信 

! 加 工 个 人 和 企业 信用 信息 ， 和 | 体 ， 兼 有 私营 征 信 机 构 的 社会 信用 体 息 中 心 ， 为 协会 会 员 提 供 个 

， 导 信 息 使 用 者 提供 独立 的 第 三 方 ， 中 类 信 代 登记 系 统 收集 的 信息 数据 主 : 要 中 个， 人 企业 福 肌 多 全 台 ， 
贷 信 息 和 个 人 信贷 信息 。 该 系统 是 非 营 ,通过 内 部 信用 信息 共享 机 制 


! 是 促进 信用 管理 立法 ， 另 一 方面 ' 务 开 商 业 银 行 防范 贷 蒜 风险 和 类 行进 和 金融 ,上 的 。 
1 是 监督 信用 管理 法 律 的 贯彻 执行 “监管 及 执行 代 和 政策 ni 


人 美国 ， 加 拿 大 ， ， 代表 国家 ， 法 国 、 德 国 、 比 利 时 、 意 大 


! 服务。 业 信 1 
1 在 社会 信用 体系 中 ， 政府 一 方面 ! 利 诞 的， 系统 信息 主要 供 银行 内 部 使 用 ， 服 ,实现 征集 和 使 用 信用 信息 的 
利 、 奥地利 、 葡 萄 牙 、 西 班 牙 ' 


图 7.6 世界 征 信 体 系 模式 的 种 类 
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从 国际 发 达 国 家 的 经 验 看 ， 征 信 体系 模式 主要 有 3 种 。 

第 一 种 ， 市 场 主导 型 模式 。 又 称 民营 模式 。 这 种 社会 信用 体系 模式 的 特征 是 征 信 机 构 
以 营利 为 目的 ， 收 集 、 加 工 个 人 和 企业 的 信用 信息 ， 为 信用 信息 的 使 用 者 提供 独立 的 第 三 
方 服务 。 在 社会 信用 体系 中 ， 政 府 的 作用 一 方面 是 促进 信用 管理 立法 ， 另 一 方面 是 监督 信 
用 管理 法 律 的 贯彻 执行 。 美 国 、 加 拿 大、 英国 和 北欧 国家 采用 这 种 社会 信用 体系 模式 。 
第 二 种 ， 政 府 主导 型 模式 。 又 称 公 共 模 式 或 中 央 信 贷 登 记 模式 。 这 种 模式 是 以 中 央 银 
行 建立 的 “中 央 信贷 登记 系统 ”为 主体 ， 兼 有 私营 征 信 机 构 的 社会 信用 体系 。 中 央 信 贷 登 
记 系统 是 由 政府 出 资 建 立 的 全 国 数据 库 网 络 系统 ， 直 接 隶 属于 中 央 银行 。 中 央 信 贷 登记 系 
统 收 集 的 信息 数据 主要 是 企业 信贷 信息 和 个 人 信贷 信息 。 该 系统 是 非 营 利 性 的 ， 系 统 信息 
主要 供 银 行内 部 使 用 ， 服 务 于 商业 银行 防范 贷款 风险 和 央行 进行 金融 监管 及 执行 货币 政 
策 。 据 世界 银行 统计 ， 法 国 、 德 国 、 比 利 时 、 意 大 利 、 奥 地 利 、 葡 萄 牙 和 西班牙 7 个 国家 
有 公共 信用 登记 机 构 ， 即 中 央 信 贷 登记 系统 。 其 中 ， 除 法 国外 ， 其 他 6 国都 有 市 场 化 运营 
的 私人 征 信 机 构 。 

第 三 种 ， 会 员 制 模式 。 它 是 指 由 行业 协会 为 主 建立 信用 信息 中 心 ， 为 协会 会 员 提 供 个 
人 和 企业 的 信用 信息 互 换 平台 ， 通 过 内 部 信用 信息 共享 机 制 实现 征集 和 使 用 信用 信息 的 目 
的 。 在 会 员 制 模式 下 ， 会 员 向 协会 信息 中 心 义务 地 提供 由 会 员 自 身 掌 握 的 个 人 或 者 企业 的 
信用 信息 ， 同 时 协会 信用 信息 中 心 也 仅 限 于 向 协会 会 员 提 供 信用 信息 查询 服务 。 这 种 协会 
信用 信息 中 心 不 以 营利 为 目的 ， 只 收取 成 本 费用 。 日 本 采用 这 种 社会 信用 体系 模式 。 

1) 美国 的 市 场 主导 型 模式 

美国 的 征 信 业 始 于 1841 年 ， 第 一 家 征 信 所 是 由 纽约 的 一 名 纺织 批发 商 刘 易 斯 。 塔 潘 
所 建立 。1870 年 ，R. G. 邓 恩 接管 了 这 家 征 信 所 ， 后 来 又 与 布雷 效 特 里 特征 信和 所 合并 ， 组 
成 Dun & Bradstreet。 从 简单 征 信服 务 到 比较 完善 的 现代 信用 体系 的 建立 ， 美 国 的 征 信 业 差 
不 多 经 历 了 160 多 年 的 时 间 。 

“美国 模式 ”是 典型 的 市 场 主导 型 。 美 国 的 征 信服 务 机 构 都 是 独立 于 政府 之 外 的 民营 
征 信 机 构 (或 称 为 私人 信用 调查 机 构 )， 是 按照 现代 企业 制度 方式 建立 ， 并 依据 市 场 化 原则 
运作 的 征 信服 务 主体 。 

美国 的 征 信服 务 机 构 具 有 明显 特征 : 四 在 机 构 组 成 方面 ， 征 信 机 构 主要 由 私人 和 法 人 
投资 组 成 。@ 在 信息 来 源 方面 ， 民 营 征 信 机 构 的 信息 来 源 广泛 。 消 费 者 信用 调查 机 构 的 信 
用 信息 除了 来 自 银行 和 相关 的 金融 机 构 外 ， 还 来 自信 贷 协 会 和 其 他 各 类 协会 、 财 务 公司 或 
租赁 公司 、 信 用 卡 发 行 公司 和 商业 零售 机 构 等 。@@ 在 信用 信息 内 容 方面 ， 民 营 征 信 机 构 的 
信息 较为 全 面 ， 不 仅 征集 负面 信用 信息 ， 也 征集 正面 信息 。 外 在 服务 范围 方面 ， 美 国民 营 
信用 调查 机 构 是 面向 全 社会 提供 信用 信息 服务 。 服 务 的 对 象 主要 包括 私人 银行 、 私 人 信用 
机 构 、 其 他 企业 、 个 人 、 税 收 征管 机 构 、 法 律 实施 机 构 和 其 他 联邦 机 构 ， 以 及 本 地 政府 机 
构 等 ， 这 些 机 构 都 是 征 信 报 告 的 需求 方 。 

美国 对 征 信 的 立法 是 由 于 20 世纪 70 年 代 征 信 业 快速 发 展 导致 了 一 系列 问题 而 开始 ， 
走 的 是 一 条 在 发 展 中 规范 的 立法 过 程 。 到 现在 美国 不 仅 具 备 了 较为 完善 的 信用 法 律 体系 和 
政府 监管 体系 ， 而 且 与 市 场 经 济 的 发 展 相伴 随 ， 形 成 了 独立 、 客 观 、 公 正 的 法 律 环境 。 政 
府 基本 上 处 于 社会 信用 体系 之 外 ， 主 要 负责 立法 、 司 法 和 执法 ， 建 立 起 一 种 协调 的 市 场 环 
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境 和 市 场 秩序 ， 同 时 其 本 身 也 成 为 商业 性 征 信 公司 的 评级 对 象 ， 这 样 就 保证 了 征 信 公司 能 
确保 其 独立 性 、 中 立 性 和 公正 性 。 

美国 的 信用 管理 法 律 制 度 可 以 划分 为 3 个 层次 。 第 一 层次 是 直接 的 信用 管理 法 律 规 
定 。 第 二 层次 是 直接 保护 个 人 隐私 的 法 律 ， 这 些 法 律 都 直接 规定 ， 在 相应 的 特殊 环境 中 不 
能 公布 或 者 限制 公布 个 人 或 企业 的 相关 信息 。 第 三 层次 是 指 规范 政府 信息 公开 的 法 律 ， 为 
征 信 机 构 收集 政府 公开 信息 提供 法 律 依据 。 

2) ”欧洲 的 政府 主导 型 模式 

欧洲 征 信 业 的 发 展 主要 采用 的 是 政府 主导 型 模式 。 欧 洲 对 于 征 信 的 立法 最 初 是 源 于 对 
数据 、 个 人 隐私 的 保护 ， 因 此 与 美国 相 比 ， 欧 洲 具 有 较 严 格 的 个 人 数据 保护 法 律 。 

欧洲 的 政府 主导 型 征 信 模 式 与 美国 的 市 场 化 模式 的 差别 体现 在 3 个 方面 : 一 是 信用 信 
息 服 务 机 构 是 被 作为 中 央 银 行 的 一 个 部 门 建立 ， 而 不 是 由 私人 部 门 发 起 设立 。 二 是 银行 需 
要 依法 向 信用 信息 局 提供 相关 信用 信息 。 三 是 中 央 银 行 承担 主要 的 监管 职能 。 

3) 日 本 的 会 员 制 征 信 模式 

日 本 的 征 信 体 系 明显 区 别 于 美国 和 西欧 国家 ， 采 用 的 是 会 员 制 征 信 模 式 ， 这 主要 是 由 
于 日 本 的 行业 协会 在 日 本 经 济 中 具有 较 大 的 影响 力 。 尤 其 对 于 个 人 征 信 而 言 ， 在 日 本 没有 
商业 化 运作 的 个 人 征 信 企 业 。 

目前 ， 日 本 的 信用 信息 机 构 大 体 上 可 划分 为 银行 体系 、 消 费 信贷 体系 和 销售 信用 体系 
3 类 。 相 应 的 行业 协会 分 别 是 银行 业 协会 、 信 贷 业 协会 和 信用 产业 协会 。 这 些 协会 的 会 员 
包括 银行 、 信 用 卡 公司 、 保 证 公司 、 其 他 金融 机 构 、 商 业 公 司 、 零 售 店 等 。 三 大 行业 协会 
的 信用 信息 服务 基本 能 够 满足 会 员 对 个 人 信用 信息 征集 考查 的 需求 。 例 如 ， 日 本 银行 协会 
建立 了 非 营 利 的 银行 会 员 制 机 构 ， 即 日 本 个 人 信用 信息 中 心 ， 地 方 性 的 银行 作为 会 员 参 加 
“信息 中 心 ”。 到 1988 年 ， 全 国 银行 协会 把 日 本 国内 的 信息 中 心 统一 起 来 ， 建 立 了 全 国 
银行 个 人 信息 中 心 。 信 息 中 心 的 信息 来 源 于 会 员 银行 ， 会 员 银行 在 与 个 人 签订 消费 贷款 的 
合同 时 ， 均 要 求 个 人 义务 提供 真实 的 个 人 信用 信息 。 这 些 个 人 信息 中 心 负责 对 消费 者 个 人 
或 企业 进行 征 信 。 该 中 心 在 收集 与 提供 信息 服务 时 要 收费 ， 以 维持 中 心 的 运行 与 发 展 ， 但 
不 以 营利 为 目的 。 不 过 ， 日 本 征 信 业 同时 也 存在 一 些 商业 性 的 征 信 公 司 。 
本 的 消费 者 信用 信息 并 不 完全 公开 ， 只 是 在 协会 成 员 之 间 交 换 使 用 ， 以 前 并 无 明确 
的 法 律 规定 ， 但 在 银行 授信 前 ， 会 要 求 借款 人 签订 关于 允许 将 其 个 人 信息 披露 给 其 他 银行 
的 合同 。 日 本 也 注重 完善 了 有 关 保 护 个 人 隐私 的 基本 法 律 ， 重 点 确定 个 人 金融 信用 信息 、 
医疗 信息 、 通 信 信 息 的 开放 程度 。 


2. 我 国 征 信 体 系 模式 


1) “我 国 的 政府 主导 型 模式 

当前 ， 政 府 主导 型 的 征 信 机 构 占 据 绝对 优势 。 外 商 独资 型 公司 的 服务 对 象 主要 是 外 商 
且 规模 较 小 。 而 中 外 合资 的 征 信 机 构 发 展 势头 较 快 ， 私 营 征 信 机 构 发 展 受到 的 限制 最 大 。 

与 美 、 德 、 日 相对 比 ， 我 国 公共 征 信 机 构 占 主导 地 位 ， 私 人 征 信 机 构 数量 和 规模 都 很 
小 ， 发 展 前 景 广阔 。 根 据 国际 经 验 ， 一 国 个 人 征 信 机 构 体系 应 与 本 国 征 信 业 的 发 展 特点 相 
适应 ， 相 较 于 美国 的 完全 市 场 化 模式 和 日 本 的 协会 模式 ， 我国 与 欧洲 的 政府 主导 模式 可 能 
会 更 为 相近 。 


220 


大 数据 征 信 国王 亲 阐 


2) 征 信 体系 的 框架 构成 

征 信 体 系 是 伴随 着 信用 经 济 的 发 展 ， 逐 步 形 成 的 相互 联系 的 整体 结构 。 它 是 客观 存在 
的 系统 性 体系 结构 ， 包 含 许多 信用 经 济 乃 至 市 场 经 济 发 展 过 程 中 必 备 的 子 领域 ， 共 同 构 成 
信用 经 济 发 展 不 可 或 缺 的 市 场 服 务 和 监督 系统 ， 保 障 信用 经 济 的 健康 稳定 发 展 ， 维 护 正常 
的 信用 经 济 秩序 和 环境 。 社 会 征 信 体 系 如 图 7.7 所 示 。 


| | 1 | | 


征 信 立 法 系统 ” 征 信 监管 体系 征 信服 务 行业 失信 惩罚 机 制 人 才 培 养 模式 


人 
边 专 监 行 企 消 财 市 资 征 采 市 专 职 
缘 业 管 业 业 费 产 场 信 信人 和 集 场 业 业 
法 法 机 自 资 者 征调 评 数 征 联 技 道 
律 人 律 构 人 律 信 信和 信 查 估 和 据 信 防 能 德 
法 监 监 调 用 开 数 机 培 要 

中 要 发 据 制 训 求 


7.7 ”社会 征 信 体 系 


一 般 来 讲 ， 征 信 体 系 包含 一 些 相互 联系 的 子 体系 ， 上 有 具体 如 下 。 

(1) 征 信 立 法 系统 。 征 信 立 法 系统 主要 负责 征 信 行业 法 律 法 规 的 制定 和 执行 ， 监 管 征 
信行 业 发 展 的 规范 性 和 维护 征 信 市 场 的 市 场 准 则 ， 同 时 督促 征 信行 业内 部 进行 行业 自律 ， 
从 外 部 和 内 部 加 强 对 征 信行 业 发 展 的 指导 和 监督 。 其 中 ， 不 仅 有 与 征 信 相 关 的 基础 法 律 体 
系 (一 般 称 之 为 “边缘 法 ”)， 而 且 也 有 征 信 专业 法 律 系统 。 

(2) 征 信 监 管 体 系 。 征 信 体 系 为 社会 提供 征 信 服务 ， 除 了 在 法 律 允许 范围 内 开展 业务 
之 外 ， 还 要 有 必要 的 监管 体系 来 行使 约束 其 行为 的 职能 。 征 信 监 管 体系 主要 由 政府 专 设 的 
监管 机 构 和 行业 自律 组 织 负责 整个 征 信服 务 行业 的 管理 和 指导 。 

(3) 征 信服 务 行业 。 在 信用 管理 行业 内 部 ， 征 信服 务 是 一 种 基础 性 服务 。 它 受 委托 人 
的 委托 进行 调查 ， 以 一 种 或 若干 种 调查 和 分 析 报 告 类 的 征 信 产 品 作为 回复 ， 帮 助 委托 人 获 
取信 用 信息 ， 以 便 做 出 合适 的 决策 。 

(4) 失信 惩罚 机 制 。 所 谓 失信 第 罚 机 制 ， 它 是 社会 征 信 体 系 中 重要 的 “部 件 ” 之 一 ， 
主要 通过 经 济 手段 和 道德 谴责 ， 惩 罚 市 场 经 济 活动 中 的 失信 者 ， 将 有 严重 经 济 失信 行为 的 
企业 和 个 人 从 市 场 的 主流 中 剔除 出 去 。 同 时 ， 失 信 惩 罚 机 制 可 以 使 政策 向 诚实 守信 的 企业 
和 消费 者 倾斜 ， 间 接 降 低 守 信用 企业 获取 资本 和 技术 的 门槛 ， 消 除 障 碍 和 壁垒 。 失 信 惩 罚 
机 制 的 最 大 特征 就 是 对 失信 行为 的 出 击 是 主动 的 ， 而 不 像 征 信服 务 那样 是 被 动 的 ， 只 有 在 
接受 委托 人 的 具体 委托 后 才 提 供 征 信服 务 。 这 样 ， 失 信 惩罚 机 制 和 征 信服 务 可 以 主动 与 被 
动 相 结合 ， 共 同 维护 征 信 体 系 的 良好 运行 ， 保 证 健康 有 序 的 经 济 秩序 。 失 信 惩罚 机 制 的 工 
作 原 理 如 图 7.8 所 示 。 
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7.8 失信 惩罚 机 制 的 工作 原理 


(5) 人 才 培 养 模式 。 征 信行 业 是 一 个 对 于 经 验 要 求 比较 高 、 知 识 面 要 求 比较 广 的 行 
业 。 在 这 一 领域 的 从 业 人 员 ， 除 了 具有 专业 的 财务 管理 、 市 场 营销 、 经 济 法 、 管 理学 等 基 
础 知识 之 外 ， 还 要 有 一 定 的 职业 道德 和 素养 。 为 此 ， 在 征 信 人 才 培 训 过 程 中 ， 有 必要 注重 
专业 知识 和 从 业 道 德 的 双重 培养 ， 全 面 提高 从 业 人 员 的 综合 素质 。 

由 此 可 见 ， 社 会 征 信 体 系 是 一 个 庞大 的 相互 联系 的 紧密 体系 ， 包 含 众 多 的 子 体系 相互 
作用 ， 需 要 众多 的 社会 力量 相互 联动 ， 其 中 既 有 外 界 提供 的 法 律 、 环 境 等 因素 作为 保障 ， 
又 有 征 信 体系 内 部 专业 理论 知识 、 技 能 作为 支撑 。 只 有 在 各 个 子 体系 均 发 挥 作 用 的 情况 
下 ， 才 可 能 真正 体现 社会 征 信 体 系 的 服务 和 保障 作用 ， 为 信用 经 济 的 深入 发 展 提供 必要 的 
支持 和 相关 的 服务 。 

3) ” 征 信 体系 各 个 子 系统 之 间 的 协调 与 完善 机 制 

征 信 体系 各 个 子 系统 之 间 是 一 个 相互 影响 、 相 互 作用 的 有 机 整体 ， 其 中 每 一 个 体系 都 
发 挥 着 各 自 应 有 的 作用 ， 如 果 其 中 任何 一 个 体系 出 现 运 行 障碍 和 错误 ， 势 必 影 响 其 他 体系 
的 运作 效率 ， 带 来 不 必要 的 麻烦 。 如 图 7.9 所 示 为 征 信 体 系 各 子 系统 的 协调 和 完善 示意 图 。 


图 7.9 征 信 体 系 各 子 系统 的 协调 和 完善 
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(D 征 信 立法 系统 是 整个 征 信 体 系 建设 的 基础 和 依据 ， 只 有 完善 的 法 律 法 规 体系 才能 
保障 征 信 体 系 建设 有 章 可 循 ， 有 法 可 依 。 

许多 国家 的 征 信 法 律 法 规 都 明确 地 指出 了 征 信 数 据 采集 的 渠道 和 征 信 信 息 使 用 的 方 
式 ， 为 征 信 体 系 建设 从 一 开始 就 沿 着 良性 轨道 发 展 ， 黄 定 了 必要 的 法 律 基础 ， 同 时 也 为 征 
信 监 管 有 效 的 发 挥 作用 提供 了 法 律 保障 。 一 个 国家 的 信用 管理 体系 建设 和 征 信 服务 的 全 面 
开展 ， 首 先 必 须 创 造 必 要 的 法 制 环 境 。 要 保障 征 信 数据 的 开放 ， 规 范 授信 和 信用 管理 行 
为 ， 保 护 消费 者 的 权益 ， 就 必须 有 一 系列 相关 的 法 律 法 规 及 相应 的 惩罚 机 制 。 建 立 完善 、 
高 效 的 信用 管理 法 制 环境 是 信用 行业 健康 规范 发 展 的 基础 和 必然 要 求 ， 也 是 跨 入 征 信 国 家 
的 最 主要 标志 。 

(2) 征 信 监 管 体 系 对 征 信 机 构 的 征 信行 为 进行 必要 的 监督 和 管理 ， 规 范 征 信 机 构 的 行 
为 ， 维 护 征 信 市 场 的 秩序 。 

归纳 起 来 ， 征 信 监 管 体系 的 主要 功能 有 6 个 方面 : 第 一 ， 根 据 法 律 对 不 讲 信用 的 责任 
人 了 予以 惩处 ， 第 二 ， 教 育 民 众 在 对 失信 责任 人 的 惩罚 期 内 ， 不 要 对 其 进行 任何 形式 的 授 
信 ; 第 三 ， 在 法 定期 限 内 ， 政 府 工商 注册 部 门 不 允许 有 严重 违约 记录 的 企业 法 人 和 主要 责 
任 人 注 册 新 企业 ; 第 四 ， 人 允许 信用 服务 公司 在 法 定 的 期 限 内 ， 长 期 保存 并 传播 失信 人 的 原 
始 不 良 记 录 ; 第 五 ， 对 有 违规 行为 的 信用 服务 公司 进行 监督 和 处 罚 ; 第 六 ， 制 定 执行 有 关 
法 案 的 具体 规定 。 除 此 之 外 ， 征 信行 业 的 行业 自律 组 织 在 各 个 机 构 自愿 的 前 提 下 ， 依 靠 竞 
争 规则 和 道德 准则 ， 使 各 成 员 自 觉 维护 其 权威 性 和 制约 性 。 与 政府 专 设 监管 机 构 相 比较 ， 
虽然 监管 效能 和 约束 力度 相对 较 差 ， 但 是 在 维护 征 信行 业 合理 有 序 竞 争 和 健康 持续 发 展 方 
面 ， 同 样 具 有 自己 特殊 的 效力 和 功能 ， 也 是 征 信 监 管 必 不 可 少 的 内 容 。 

(3) 征 信服 务 行业 是 征 信 体 系 的 主力 军 ， 在 征 信 法 律 和 征 信 监管 的 框架 下 发 展 和 
壮大 。 

征 信服 务 有 两 个 特点 ， 也 是 其 两 个 优点 : 一 是 在 被 调查 对 象 不 知情 的 情况 下 完成 ， 有 
助 于 保证 调查 结果 的 公正 和 客观 ， 二 是 征 信 结 果 可 以 支持 失信 惩罚 机 制 ， 对 失信 者 给 予 必 
要 的 惩罚 和 制裁 。 其 中 主要 的 征 信 服务 有 企业 资信 调查 (企业 征 信 )、 消 费 者 信用 调查 (个 人 
征 信 )、 财 产 征 信 、 市 场 调查 和 资信 评估 。 征 信 体 系 的 主体 活动 就 是 征 信 机 构 开展 的 各 种 征 
信服 务 ， 征 信 机 构 也 是 征 信 市 场 上 最 为 活跃 的 市 场 主体 ， 也 正 是 征 信 机 构 之 间 的 自由 竞争 
和 优胜 劣 汰 ， 才 保持 着 征 信 体 系 旺盛 的 生命 力 和 无 尽 的 活力 。 

(4) 失信 惩罚 机 制 是 征 信 体 系 的 坚强 后 盾 ， 给 失信 者 严厉 的 惩戒 ， 给 守信 者 实惠 的 
奖励 。 

征 信 立 法 和 征 信 监 管 侧重 约束 和 规范 征 信 机 构 的 行为 ， 保 护 被 征 信者 的 合法 权益 ， 但 
是 征 信 的 目的 在 于 揭示 信用 信息 ， 塑 造 良 好 的 信用 环境 。 所 以 ， 征 信 作 用 的 发 挥 主要 还 是 
依靠 激励 机 制 和 惩罚 机 制 ， 只 有 奖惩 分 明 ， 才 能 达到 保护 守信 者 ， 惩 罚 失 信者 的 目的 。 因 
此 ， 失 信 惩罚 机 制 的 存在 ， 就 像 一 道 天 然 的 防御 屏障 ， 对 那些 妨碍 征 信 体 系 建设 的 失信 者 
给 予 惩 戒 ， 同 时 激励 守信 者 。 

(5) 人 才 培 养 模式 是 征 信 体 系 建设 的 根本 。 
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任何 工作 都 需要 有 专业 知识 和 技术 的 人 才 来 完成 ， 征 信行 业 同样 也 不 例外 。 征 信 体 系 
建设 归根 结 底 要 靠 人 才 ， 离 开 了 征 信人 才 ， 再 先进 的 法 律 、 再 有 效 的 监管 、 再 完善 的 服务 
也 无 法 构筑 适合 中 国 目前 现实 国情 的 征 信 体 系 。 当 然 ,在 注重 征 信 专 业 技术 知识 教育 的 同 
时 ， 千 万 不 能 忽视 征 信人 员 职 业 道 德 修养 的 培养 ， 必 须 建设 公正 客观 的 征 信 人 才 队 伍 。 

总 之 ， 征 信 体 系 各 个 子 系统 之 间 是 相互 作用 、 协 调 发 展 的 整体 ， 任 何 一 个 分 支 系统 都 
对 其 他 系统 产生 影响 ， 在 征 信 体 系 建设 的 过 程 中 ， 关 键 不 在 于 各 个 子 系统 分 别 建设 得 多 么 
成 功 和 完善 ， 而 在 于 处 理 好 各 个 子 系统 之 间 的 协调 运作 ， 相 互 配 合 。 

下 面 以 费 埃 哲 (Fair Isaac Company) 为 例 进行 介绍 。 

FICO 信用 分 是 由 美国 个 人 消费 信用 评估 公司 (Fair Isaac Company) 开 发 出 的 一 种 个 人 信 
用 评级 法 ， 已 经 得 到 社会 广泛 接受 。 

FICO 信用 分 是 最 常用 的 一 种 普通 信用 分 。 由 于 美国 三 大 信用 局 (Experian、Equifax、 
TransUnion) 都 使 用 FICO 信用 分 ， 每 一 份 信用 报告 上 都 附 有 FICO 信用 分 ， 以 至 于 FICO 
信用 分 成 为 信用 分 的 代名词 。20 世纪 50 年 代 一 位 工程 师 B 鹿 Fair 和 一 位 数学 家 Earl Isaac 
发 明了 一 个 信用 分 的 统计 模型 ，80 年 代 开 始 在 美国 流行 。 如 今 它 是 美国 Fair Isaac& 
Company 的 专 有 产品 ，FICO 信用 分 由 此 得 名 。FICO 信用 分 模型 利用 高 达 100 万 的 大 样本 
数据 ， 首 先 确定 刻画 消费 者 的 信用 、 品 德 ， 以 及 支付 能 力 的 指标 ， 再 把 各 个 指标 分 成 若干 
个 档次 以 及 各 个 档次 的 得 分 ， 然 后 计算 每 个 指标 的 加 权 ， 最 后 得 到 消费 者 的 总 得 分 。FICO 
信用 分 的 打分 范围 是 300 一 850 分 。 

虽然 在 审查 各 种 信用 贷款 申请 时 ， 每 个 金融 机 构 都 有 各 自 的 方法 和 分 数 线 ，FICO 信 
用 分 可 以 帮助 它们 决策 。 然 而 信用 分 虽然 可 以 作为 发 放贷 款 的 决策 工具 ， 但 不 应 当成 为 决 
策 的 唯一 依据 ， 更 不 能 代替 人 的 决策 。 

美国 的 法 律 禁止 信用 分 作为 拒绝 消费 贷款 的 唯一 理由 。 一 般 地 说 ， 如 果 借 款 人 的 信用 
分 达到 680 分 以 上 ， 人 金融 机 构 就 可 以 认为 借款 人 的 信用 卓著 ， 可 以 毫 不 迟疑 地 同意 发 放贷 
款 。 如 果 借 款 人 的 信用 分 低 于 620 分 ， 金 融 机 构 或 者 要 求 借 款 人 增加 担保 ， 或 者 干脆 寻找 
各 种 理由 拒绝 贷款 。 如 果 借 款 人 的 信用 分 为 620~680 分 ， 金 融 机构 就 要 做 进一步 的 调查 
核实 ， 采 用 其 他 的 信用 分 析 工 具 ， 作 个 案 处 理 。 信 用 分 低 于 600 分 ， 借 款 人 违约 的 比例 是 
1/8; 信用 分 为 700 一 800 分 ， 违 约 率 为 1/123; 信用 分 高 于 800 分 ， 违 约 率 为 1/1292。 

FICO 信用 分 计算 方法 是 把 借款 人 过 去 的 信用 历史 资料 与 数据 库 中 的 全 体 借款 人 的 信 
用 习惯 相 比 较 ， 检 验 借款 人 跟 经 常 违 约 、 随 意 透支 、 甚 至 申请 破产 等 各 种 陷入 财务 困境 的 
借款 人 的 发 展 趋势 是 否 相似 。 

如 图 7.10 所 示 为 FICO 个 人 信用 评分 表 。 

FICO 评分 模型 中 所 关注 的 主要 因素 有 5 类 ， 分 别 是 客户 的 信用 偿还 历史 、 信 用 账户 
数 、 使 用 信用 的 年 限 、 正 在 使 用 的 信用 类 型 、 新 开 立 的 信用 账户 。 评 分 权重 占 比 如 表 7.1 
所 示 。 
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住房 自 有 租赁 其 他 无 信息 
25 15 10 17 
现 地 址 居住 时 (年 ): <<0.5 0.5~2.49 2.5 一 6.49 6.5 一 10.49 >10.49 无 信息 
这 10 节 19 23 13 
职务 : 专业 人 员 半 专 业 管理 人 员 办 公 室 蓝领 退休 其 他 无 信息 
50 40 31 28 25 31 22 27 
工龄 ，<0.5 0.5~1.49 1.5~2.49 2.5 一 5.49 5.5 一 12.49 > 12.5 退休 无 信息 
2 8 19 25 30 39 43 20 
信用 卡 : 无 非 银行 信用 卡 主要 贷 记 卡 两 者 都 有 无 回答 无 信息 
0 11 16 27 10 12 
银行 开户 情况 : 个 人 支票 储 蕾 账 户 两 者 都 有 其 他 无 信息 
5 10 20 11 9 
债务 收入 比例 ， 二 15% 15% 一 20% 26% 一 35% 36% 一 49% > 之 50% 无 信息 
22 15 12 5 0 13 
1 年 以 内 查询 次 数 : 0 1 2 3 4 5~9 无 记录 
3113 -7-7-20 0 
使 用 档案 年 限 ， <0.5 1~23~4 5~7 >7 
0 5 15 30 40 
循环 信用 透支 账户 个 数 : 0 1~2 3~5 >5 
512 8 -4 
信用 额度 利用 率 : 0~15% 16%~30% 31%~40% 41%~50% 之 50% 
15 3 -3 -10 -18 
毁誉 记录 : 无 记录 有 记录 轻微 毁誉 第 一 满意 线 第 二 满意 线 第 三 满意 线 
0 -29 -14 17 24 29 


7.10 ”FICO 个 人 信用 评分 表 
表 7.1 FICO 评分 规则 


评分 项 占 比 评分 规则 

信用 账户 的 还 款 记 录 ， 包 括 信用 卡 、 零 售 账户 (从 商户 的 几 购 内销 情况 获 
得 )、 分 期 偿还 贷款 、 金 融 公 司 账户 、 抵 押 贷 款 ， 信 用 公开 记录 ， 主 要 包括 
35% | 破产 记录 、 丧 失 抵押 品 赎 回 权 记 录 、 法 律 诉 讼 事件 、 留 置 权 记录 及 判决 ， 逾 
期 偿还 ， 包 括 逾 期 的 天 数 、 未 偿还 的 金额 、 逾 期 还 款 的 次 数 和 逾期 发 生 时 距 
现在 的 时 间 等 


信用 偿还 历史 


每 个 月 仍 需要 偿还 的 信用 账户 数 ， 仍 需要 偿还 的 分 类 账户 数 ， 如 仍 需 要 偿还 
30% | 的 信用 卡 数量 ， 分 期 付款 账户 数 等 ， 信 用 账户 的 余额 ， 总 信用 额度 的 使 用 
率 ， 使 用 率 越 高 ， 则 说 明 客 户 的 信用 风险 越 大 ， 分 期 付款 账户 偿还 率 

一 般 来 讲 ， 使 用 信用 账户 的 历史 越 长 ， 越 能 增加 FICO 信用 分 ， 这 项 因素 主 
要 考虑 平均 信用 账户 账 龄 


信用 账户 数 


使 用 信用 账户 的 
15% 


客户 的 信用 卡 账户 、 零 售 账户 、 分 期 付款 账户 、 金 融 公司 账户 和 抵押 贷款 账 
户 的 混合 使 用 情况 ， 包 括 持 有 的 信用 账户 类 型 和 每 种 类 型 的 信用 账户 数 


新 开 立 的 信用 账户 | 10% 
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续 表 
评分 项 评分 规则 
新 开 立 的 信用 账户 类 型 及 总 数 ， 新 开 立 的 信用 账户 账 龄 ;信用 查询 申请 数 
正在 使 用 的 信用 量 ， 查 询 次 数 在 信用 报告 中 保存 2 年 ;贷款 方 查询 客户 信用 距离 现在 的 时 间 
类 型 长 短 ; 最 近 的 信用 情况 ， 对 新 开 立 的 信用 账户 及 时 还 款 ， 会 在 一 段 时 间 后 提 
高 客户 的 FICO 信用 分 
1) ”偿还 历史 


影响 FICO 得 分 的 最 重要 的 因素 是 客户 的 信用 偿还 历史 ， 大 约 占 总 影响 因素 的 35%。 
支付 历史 主要 显示 客户 的 历史 偿还 情况 ， 以 帮助 贷款 方 了 解 该 客户 是 否 存在 历史 的 逾期 还 
款 记 录 ， 主 要 包括 以 下 几 个 方面 。 

(1) 各 种 信用 账户 的 还 款 记录 。 包 括 信 用 卡 ( 如 Visa 、MasterCard 、American 
Express、Discover)、 零 售 账户 (直接 从 商户 获得 的 信用 )、 分 期 偿还 贷款 、 金 融 公 司 账 户 、 
抵押 贷款 。 

(2) 公开 记录 及 支票 存款 记录 。 主 要 包括 破产 记录 、 甫 失 抵押 品 赎 回 权 记录 、 法 律 诉 
讼 事件 、 留 置 权 记 录 及 判决 。 涉 及 金额 大 的 事件 比 金额 小 的 对 FICO 得 分 的 影响 要 大 ， 同 
样 的 金额 下 ， 越 晚 发 生 的 事件 要 比 早 发 生 的 事件 对 得 分 的 影响 大 。 一 般 来 讲 ， 破 产 信息 会 
在 信用 报告 上 记录 7 一 10 年 。 

(3) 逾期 偿还 的 具体 情况 。 包 括 逾期 的 天 数 、 未 偿还 的 金额 、 逾 期 还 款 的 次 数 和 逾期 
发 生 时 距 现 在 的 时 间 长 度 等 。 

2) ”信用 账户 数 

该 因素 仅 次 于 还 款 历史 记录 对 得 分 的 影响 ， 占 总 影响 因素 的 30%。 对 贷款 方 来 讲 ， 一 
个 客户 有 信用 账户 需要 偿还 贷款 ， 并 不 意味 着 这 个 客户 的 信用 风险 高 。 相 反 ， 如 果 一 个 客 
户 有 限 的 还 款 能 力 被 用 尽 ， 则 说 明 这 个 客户 存在 很 高 的 信用 风险 ， 有 过 度 使 用 信用 的 可 
EE ， 同 时 也 就 意味 着 他 具有 更 高 的 逾期 还 款 可 能 性 。 该 类 因素 主要 是 分 析 对 于 一 个 客户 ， 
究竟 多 少 个 信用 账户 是 足够 多 的 ， 从 而 能 够 准确 反映 出 客户 的 还 款 能 力 。 

3) ”使 用 信用 的 年 限 

该 项 因素 占 总 影响 因素 的 15%。 一 般 来 讲 ， 使 用 信用 的 历史 越 长 ， 越 能 增加 FICO 信 
用 得 分 。 该 项 因素 主要 是 指 信用 账户 的 账 龄 ， 既 考虑 最 早 开 立 的 账户 的 账 龄 ， 也 包括 新 开 
立 的 信用 账户 的 账 龄 ， 以 及 平均 信用 账户 账 龄 。 据 信用 报告 反映 ， 美 国 最 早 开 立 的 信用 账 
户 的 平均 账 龄 是 14 年 ， 超 过 25% 的 客户 的 信用 历史 长 于 20 年 ， 只 有 不 足 5% 的 客户 的 信 
用 历史 小 于 2 年 。 

4) “新 开 立 的 信用 账户 

该 项 因素 占 总 影响 因素 的 10%。 在 现今 的 经 济 生活 中 ， 人 们 总 是 倾向 于 开 立 更 多 的 信 
用 账户 ， 选 择 信用 购物 的 消费 方式 ，FICO 评分 模型 也 将 这 种 倾向 体现 在 信用 得 分 中 。 据 
调查 ， 在 很 短 时 间 内 开 立 多 个 信用 账户 的 客户 具有 更 高 的 信用 风险 ， 尤 其 是 那些 信用 历史 
不 长 的 人 。 该 项 因素 主要 包括 以 下 几 个 方面 。 

(1) 新 开 立 的 信用 账户 数 ， 系 统 将 记录 客户 新 开 立 的 账户 类 型 及 总 数 。 
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(2) 新 开 立 的 信用 账户 账 龄 。 

(3) 目前 的 信用 申请 数量 ， 该 项 内 容 主 要 由 查询 该 客户 信用 的 次 数 得 出 ， 查 询 次 数 在 
信用 报告 中 只 保存 2 年 。 

(4) 贷款 方 查询 客户 信用 的 时 间 长 度 。 

(5) 最 近 的 信用 状况 ， 对 新 开 立 的 信用 账户 及 时 还 款 ， 会 在 一 段 时 间 后 ， 提 高 客户 的 
FICO 得 分 。 

5) 正在 使 用 的 信用 类 型 

该 项 因素 占 总 影响 因素 的 10%， 主 要 分 析 客 户 的 信用 卡 账户 、 零 售 账户 、 分 期 付款 账 
户 、 金 融 公司 账户 和 抵押 贷款 账户 的 混合 使 用 情况 ， 有 具体 包括 持 有 的 信用 账户 类 型 和 每 种 
类 型 的 信用 账户 数 。 


(DB 大 数据 征 信 


7.2.1 大 数据 征 信 概述 

1. 大 数据 征 信 的 含义 

大 数据 征 信和 是 指 运用 大 数据 技术 重新 设计 征 信 评价 模型 和 算法 ， 通 过 多 维度 的 信用 信 
息 考 察 ， 形 成 对 个 人 、 企 业 、 社 会 团体 的 信用 评价 。 

大 数据 征 信 数 据 主 要 来 源 于 网 络 上 的 公开 数据 、 用 户 授权 数据 和 第 三 方 合作 伙伴 提供 
的 数据 。 同 时 ， 互 联网 企业 通过 电 商 活动 建立 了 宝贵 的 信用 资源 ， 从 电 商 、 微 博 等 平台 获 
取 客 户 网 络 痕迹 ， 从 中 判断 借款 人 的 信用 等 级 ， 形 成 整体 风险 导向 ， 完 善 大 数据 的 积累 。 

大 数据 征 信 从 其 本 质 上 来 看 是 将 大 数据 技术 应 用 到 征 信 活 动 中 ， 突 出 强调 的 是 处 理 数 
据 的 数量 大 、 刻 画 信 用 的 维度 广 、 信 用 状况 的 动态 呈现 、 交 互 性 等 特点 ， 这 些 活动 并 未 超 
出 《 征 信 业 管理 条 例 》 中 所 界定 的 征 信 业 务 范 围 ， 本 质 上 仍然 是 对 信息 的 采集 、 整 理 、 保 
存 、 加 工 和 公布 ， 只 不 过 是 以 一 种 全 新 的 方式 、 全 新 的 视角 来 进行 而 已 。 


2. 大 数据 征 信 的 特征 与 优势 


互联 网 金融 的 业务 一 般 都 在 线 上 完成 ， 从 申请 到 完成 最 快 可 能 只 需要 几 分 钟 的 时 间 ， 
而 传统 的 征 信 流程 时 间 长 、 进 展 效率 低 、 业 务 履 盖 面 窗 ， 已 经 无 法 满足 越 来 越 多 的 业务 需 
求 。 大 数据 技术 的 发 展 ， 使 信息 来 源 收集 到 的 一 切 可 行 数据 都 成 为 信用 分 析 的 基础 ， 为 互 
联网 金融 征 信 体 系 的 建设 指引 了 新 的 方向 。 

大 数据 征 信 相 对 于 传统 征 信 有 以 下 几 点 特征 与 优势 ， 如 图 7.11 所 示 。 

1) “依托 互联 网 ， 覆 盖 范 围 大 

关于 收入 情况 、 社 保 缴 纳 、 信 用 卡 消费 等 ， 与 银行 直接 发 生 过 借贷 关系 的 人 群 ， 可 以 
通过 全 国 个 人 征 信 数 据 库 查询 到 信用 记录 ， 从 而 进行 相应 的 风险 评估 。 但 这 一 主要 数据 库 
牵涉 面 仍 十 分 有 限 。 在 互联 网 上 ， 只 要 个 体 有 登记 注册 ， 开 立 银行 账户 ， 进 行 纳 税 ， 甚 至 
社交 等 活动 ， 便 能 用 网 络 的 痕迹 ， 采 取 数 据 的 深层 挖掘 与 有 效 分 析 ， 同 样 也 可 能 获得 有 价 
值 的 信用 信息 ， 这 使 征 信人 群 辐射 范围 愈加 扩大 ， 得 到 延展 。 
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传统 征 信 互联 网 大 数据 征 信 | 


和 人 
和 

EE 法 机 
入 人 覆盖 和 人群 其 至 社交 等 活动 


除了 现金 流 等 财 

才 要 合用 传统 全、 。 台 甘 全 的 活动 多 
和。 和。 
下 社会 关系 对 毕 结 

构 化 的 数据 


离线 的 事后 
分 析 数 据 在 线 实时 更 新 


以 财务 数 所 为。 和。 数据 海量 化 、 
核心 的 小 数据 维度 化 


应 用 场景 更 加 
企业 运用 场景 by 
较 消 ， 个 人 应 化 多。 广泛， 用户 更 


用 局 限 性 天。 应 用 场景 想 多 元 ， 需 求 


图 7.11 传统 征 信 与 大 数据 征 信 的 区 别 


2) ”获取 广 谱 数 据 源 ， 多 方 渗透 

传统 征 信 主 要 使 用 传统 结构 化 数据 ， 其 主要 来 源 为 借贷 范畴 ， 而 大 数据 征 信 不 仅 限于 
目前 的 形式 ， 除 了 现金 流 等 财务 数据 外 ， 根 据 互 联网 的 活动 痕迹 ， 还 可 获知 客户 的 交易 行 
为 、 社 会 关系 等 半 结 构 化 的 数据 。 通 过 对 这 些 半 结 构 化 数据 甚至 非 结 构 化 数据 ， 进 行 不 同 
维度 、 不 同 层次 的 挖掘 与 分 析 ， 可 以 得 到 关于 人 心理 、 行 为 、 性 格 等 根本 的 有 价值 的 数据 
源 ， 使 之 成 为 新 数据 的 来 源 之 一 ， 继 而 纳入 征 信 体 系 。 由 此 可 见 ， 大 数据 提供 的 广泛 而 复 
杂 的 信息 源 对 征 信 业务 的 信用 评估 渗透 力 与 影响 力 十 分 强大 。 

3) “横向 时 间 展 开 ， 实 现 数据 实时 性 

离线 的 事后 分 析 数 据 ， 让 传统 征 信 评价 模式 陷入 了 数据 少 、 时 效 差 的 泥潭 。 在 飞速 的 
互联 网 + 金融 时 代 ， 只 关注 、 分 析 考 察 对 象 历史 信息 早已 不 够 。 取 代 传统 征 信 的 精确 性 ， 
大 数据 把 重点 转移 至 数据 相关 性 方面 。 依 靠 大 数据 所 具备 的 存量 和 热 数据 的 典型 特征 ， 数 
据 已 成 为 一 种 在 线 实时 更 新 的 状态 。 在 大 数据 征 信 的 分 析 对 象 中 ， 不 仅 包括 考察 目标 的 历 
史记 录 ， 还 在 时 间 的 横向 维度 上 加 入 当前 信息 。 当 数据 的 纵向 挖掘 与 横向 扩 宽 相 结合 时 
信用 评价 的 处 理 速度 与 决策 效率 将 更 加 高 效 。 
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4) “多 元 变量 ， 量 化 全 面 而 精确 

传统 征 信 一 般 只 针对 以 财务 数据 为 核心 的 小 数据 构建 单一 变量 。 而 科技 的 持续 前 进 ， 
让 使 用 海量 数据 有 了 新 的 可 能 。 大 数据 征 信 中 信用 评价 模型 可 以 容纳 发 展 更 多 的 变量 ， 这 
为 量化 信用 评价 结果 提供 了 全 面 而 精确 的 保障 ， 从 而 适应 快速 更 迭 的 信息 时 代 。 

5) 人 性 化 思路 ， 适 用 多 场景 

传统 征 信 体 系 的 征 信 报 告 一 般 只 有 在 信贷 业务 或 者 其 他 金融 业务 中 用 到 ， 而 大 数据 征 
信 由 于 数据 来 源 、 内 容 模型 思路 主要 来 自 借贷 场景 外 的 生活 ， 如 预订 机 票 、 酒 店 、 租 车 等 
需要 预 授权 支付 或 缴纳 押金 的 场合 ， 其 得 出 的 信用 评价 也 更 接近 于 人 的 本 性 的 判断 ， 基 本 
人 性 化 思路 发 展 ， 有 着 可 持续 发 展 前 景 。 

3. 大 数据 征 信 的 难题 


随 着 消费 金融 、 网 络 借 贷 等 互联 网 消费 模式 快速 增长 ， 以 及 大 数据 技术 突飞猛进 ， 大 
数据 征 信服 务 机 构 开 始 大 量 涌现 。 但 多 元 化 、 多 层次 征 信和 市场 体系 建设 面临 一 系列 挑战 ， 
有 很 多 难题 尚未 破解 。 

1) “数据 的 质量 、 权 威 性 问题 

相 比 于 央行 征 信 系统 的 权威 性 、 数 据 质量 的 高 可 靠 性 ， 大 数据 征 信 机 构 虽 然 数据 来 源 
更 加 宽泛 、 品 种 更 加 丰富 ， 但 数据 质量 、 权 威 性 受到 质疑 。 美 国 国家 消费 者 法 律 中 心 2014 
年 3 月 对 主要 的 大 数据 征 信 公司 进行 调查 后 发 表 了 题 为 《大 数据 ， 个 人 信用 评分 的 大 失 
望 》 的 调查 报告 ， 报 告 称 ， 大 数据 征 信 公 司 的 信息 错误 率 高 于 50%。 这 些 公司 的 数据 模型 
繁多 又 复杂 ， 使 用 不 准确 的 数据 ， 有 “垃圾 进 ， 垃 圾 出 ”之 嫌 。 

2) ”同人 不 同 信 用 问题 

决定 大 数据 模型 预测 准确 性 的 两 个 关键 因素 是 数据 和 算法 ， 各 家 征 信 机 构 的 基因 不 
同 ， 数 据 来 源 不 同 。 目 前 8 家 机 构 中 ， 鹏 远 、 中 诚信 、 中 智 诚 是 传统 型 的 征 信 机 构 ， 数 据 
来 源 主要 是 金融 数据 、 公 共 数 据 为 主 ， 而 芝麻 、 腾 讯 、 前 海 、 考 拉 、 华 道 则 除了 接 入 传统 
数据 外 ， 大 量 使 用 的 是 自身 场景 下 积累 的 数据 ， 这 导致 信用 评估 结果 在 不 同 公司 间 存 在 
差异 。 

3) “个 人 隐私 保护 及 信息 安全 问题 

根据 《 征 信 业 管理 条 例 》 规 定 ， 采 集 和 应 用 个 人 征 信 信息 必须 要 获得 征 信 主体 授权 ， 
商业 银行 在 向 人 民 银 行 征 信 中 心 报 送 和 查询 使 用 个 人 征 信 信息 时 ， 必 须 严 格 执行 此 规定 ， 
对 于 报 送 数据 范围 、 查 询 用 途 范 围 、 授 权 形 式 、 异 议 处 理 等 都 有 明确 的 界定 。 而 大 数据 征 
信 依 赖 大 量 个 人 的 互联 网 交易 记录 、 社 交 网 络 数据 ， 在 多 重 交易 和 多 方 接 入 的 情况 下 ， 隐 
私 保护 的 权利 边界 被 淡化 ， 隐 私 泄露 风险 被 迅速 放大 ， 公 民 维 护 自己 合法 权益 面临 取证 
难 、 诉 讼 难 等 问题 。 

4) ”公共 信息 的 可 获取 、 跨 机 构 信 息 的 可 交换 问题 

如 前 分 析 ， 目 前 多 家 个 人 征 信 试点 机 构 的 信息 来 源 带 有 浓厚 的 自身 经 营 特点 ， 申 请 个 
人 征 信 试点 机 构 大 多 首先 拥有 自己 的 具有 垄断 性 的 数据 资源 。 而 大 数据 征 信 要 求 的 是 信息 
的 共享 ， 而 不 是 局 部 的 垄断 和 壁垒 。 跨 机 构 拥 有 的 信息 是 否 可 交换 ， 哪 些 需要 获得 信息 主 
体 的 授权 ， 如 何 保证 交换 过 程 和 交换 后 信息 不 被 滥用 ， 在 法 律 、 监 管 、 技 术 等 方面 都 缺 


229 


大 数据 金融 与 征 信 


标准 。 同 时 ， 工 商 、 税 务 、 司 法 等 公共 政务 信息 的 可 持续 获取 ， 尚 得 不 到 保证 。 目 前 的 主 
要 做 法 是 ， 各 家 征 信 机 构 或 信息 使 用 机 构 分 散 地 获取 这 类 信息 ， 获 取 成 本 高 ， 数 据 质量 和 
数据 的 可 持续 维护 得 不 到 保证 。 

5) “信息 滥用 带 来 的 社会 安全 、 公 平 交易 问题 

从 首 批 试 点 的 8 家 个 人 征 信 机 构 的 运营 情况 看 ， 市 场 开放 之 后 ， 芝 麻 信用 、 腾 讯 征 
信 、 考 拉 征 信 等 机 构 开 始 了 一 轮 激 烈 的 追逐 赛 ， 纷 纷 推出 各 自 的 评分 产品 ， 并 争 相 在 金 
融 、 购 物 、 招 聘 、 租 车 、 和 租房、 交友、 酒店 入 住 等 领域 尝试 应 用 。 但 是 ， 这 些 机 构 绘制 出 
的 人 物 “ 肖 像 ”能 和 否 真 实 反映 个 人 信用 还 令 人 质疑 ， 获 取信 息 所 采用 的 关键 技术 的 可 靠 性 
还 有 待 进一步 检验 ， 没 有 制约 的 商业 化 应 用 很 可 能 带 来 安全 隐忧 或 消费 歧视 。 

6) 征 信 机 构 的 独立 性 问题 

从 各 国 征 信 机 构 的 发 展 历程 看 ， 狭 义 的 征 信 主 要 是 为 放贷 机 构 的 风险 管理 提供 信息 支 
持 的 活动 ， 遵 循 “ 信 息 采 集 者 与 信息 产生 没有 任何 关系 ”的 独立 第 三 方 原则 。 而 目前 试点 
的 几 家 征 信 机 构 多 不 是 独立 的 第 三 方 ， 一 方面 ， 它 们 的 数据 来 源 于 母 公司 ， 另 一 方面 ， 其 
兄弟 公司 又 涉足 放贷 业务 。 评 分 结果 对 于 其 各 自 经 营 领域 的 客户 分 析 、 风 险 判 断 具 有 强 相 
关 性 ， 但 其 他 应 用 场景 下 评分 结果 的 相关 性 则 有 待 验证 。 


7.2.2 大 数据 征 信 的 理论 基础 

1. 大 数据 征 信 的 经 济 学 原理 

1) ”信息 经 济 学 理论 

信息 经 济 学 是 以 “信息 ”为 对 象 进行 分 析 ， 优 化 资源 配置 ， 融 经 济 学 、 管 理学 、 运 筹 
学 、 系 统 科学 和 信息 科学 于 一 体 的 交叉 学 科 。 信 息 经 济 学 也 是 有 关 非 对 称 信息 下 交易 关系 
和 契约 安排 的 理论 。 交 易 双方 是 否 诚实 守信 地 履行 契约 约定 的 责任 和 义务 反映 着 信息 的 不 
对 称 性 ， 也 决定 了 交易 能 否 顺利 进行 ， 也 决定 了 风险 大 小 。 

大 数据 征 信 的 目的 就 是 通过 更 多 维度 的 信息 分 析 总 结 为 代理 人 提供 更 全 面 的 参考 ， 从 
而 帮助 代理 人 在 合理 的 措施 内 ， 有 效 减少 信息 的 不 对 称 性 ， 使 风险 降低 。 

信息 不 对 称 使 得 市 场 不 透明 ， 传 统 征 信 收 集 了 银行 系统 内 大 量 借贷 数据 ， 但 覆盖 人 群 
不 够 ， 我 国 央 行 征 信 系统 只 有 3 亿 多 人 有 借贷 历史 ， 只 占 到 中 国 13 亿 多 人 口 的 20% 多 。 
美国 也 是 如 此 ， 虽 然 三 大 征 信 局 覆盖 面 较 广 ， 但 还 是 有 一 部 分 人 没有 包含 到 。 既 然 传统 征 
信 没 有 有 效 数据 ， 就 没 法 给 那些 不 在 其 体系 内 的 人 进行 信用 评估 ， 那 么 这 些 人 需要 借贷 时 
就 会 从 传统 机 构 那里 吃 到 闭 门 美 。 而 大 数据 征 信 是 从 互联 网 上 用 户 的 交易 、 社 交 等 行为 数 
据 分 析 其 信用 资质 。 互 联网 时 代用 户 在 很 多 方面 行为 动作 都 自然 而 然 用 软件 代替 操作 ， 势 
必 留 下 了 很 多 该 个 体 的 特征 ， 利 用 数据 模型 分 析出 来 以 后 ， 便 能 形成 个 体 信 用 评价 ， 某 种 
程度 上 并 不 一 定 比 传统 征 信 的 可 靠 性 差 多 少 。 因 此 ， 大 数据 征 信 会 使 得 信息 对 称 度 提高 ， 
信息 经 济 学 是 大 数据 征 信 的 核心 理论 之 一 。 

2) “交易 费用 理论 

交易 费用 理论 核心 在 于 节省 交易 费用 ， 虽 然 企业 和 市 场 两 种 资源 配置 可 以 互相 代替 ， 
但 因为 不 确定 性 、 小 数目 条 件 、 机 会 主义 及 其 存在 有 限 理 性 有 一 定 差异 ， 致 使 交易 费用 节 
节 高 涨 。 交 易 费 用 的 攀升 会 使 得 市 场 资源 配置 效率 下 降 ， 所 以 尽量 压缩 交易 成 本 对 市 场 化 
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下 组 织 结构 和 行为 起 着 积极 正面 的 作用 。 

大 数据 征 信 作 为 新 型 而 有 效 的 征 信 系统 ， 从 人 力 成 本 、 高 效率 等 众多 方面 大 大 节约 了 
市 场 的 交易 成 本 。 

传统 征 信 因 为 某 些 原因 给 出 较 差 信用 评估 时 ， 往 往 给 予 较 高 的 借贷 费 率 。 这 就 使 得 借 
款 者 的 成 本 上 升 ， 这 不 利于 经 济 合理 发 展 。 大 数据 征 信 有 利于 个 体 信 息 尽量 对 称 ， 从 而 使 
得 整个 市 场 也 趋向 这 种 对 称 性 ， 进 而 使 得 整体 借贷 费 率 趋 于 合理 ， 这 将 促进 经 济 按 更 真实 
情况 发 展 。 

3) ”声誉 理论 

经 济 学 中 的 声誉 是 指 ， 在 各 方 信息 不 对 称 的 情况 时 ， 个 体 间 存 在 一 种 信誉 维持 ， 这 种 
维持 会 对 双方 起 到 一 定 的 正面 效用 。 存 在 相关 合同 时 ， 交 易 行为 可 以 经 由 法 律 加 以 限定 ， 
但 在 非 正式 合同 的 交易 行为 需要 声誉 来 加 以 限制 。 较 好 信誉 机 制 的 形成 有 助 于 交易 双方 降 
低 交 易 的 成 本 ， 从 长 远 看 可 以 获得 较 好 的 利益 。 同 时 ， 授 信 方 在 良好 信誉 的 关系 中 愿意 为 
受信 方 提 供 更 多 信用 服务 ， 社 会 信用 资源 也 能 随 之 增加 。 

大 数据 征 信 的 作用 在 于 促使 交易 双方 为 了 长 远 利 益 去 维护 声誉 ， 从 而 形成 稳定 健康 的 
信用 大 环境 。 

信用 不 佳 会 导致 声誉 下 降 ， 传 统 征 信 只 在 传统 借贷 范围 内 建立 信用 ， 但 其 实 人 们 的 声 
誉 在 其 各 个 行为 中 都 能 表现 出 来 。 人 们 使 用 互联 网 的 频繁 度 一 定 程度 上 已 能 反映 其 特征 ， 
声誉 好 坏 也 可 以 被 分 析出 来 ， 俗 话说 ， 人 都 是 要 面子 的 。 大 数据 征 信 一 定 程度 上 也 反映 了 
人 们 在 更 多 方面 的 声誉 度 如 何 ， 这 会 督促 人 们 保持 好 声誉 。 

4) “长 尾 理论 

长 尾市 场 也 称 之 为 “ 利 基 市 场 ”。“ 利 基 ” 一 词 是 英文 Niche 的 音译 ， 意 译 为 “ 壁 
免 ”， 有 拾遗 补 阙 或 见 颖 插 针 的 意思 。 菲 利 普 。 科 特 勒 在 《营销 管理 》 中 给 利 基 下 的 定义 
为 : 利 基 是 更 窗 地 确定 某 些 群 体 ， 这 是 一 个 小 市 场 并 且 它 的 需要 没有 被 服务 好 ， 或 者 说 
“有 获取 利益 的 基础 ”。 

大 数据 征 信 市 场 的 出 现 也 是 长 尾 理 论 创新 应 用 之 一 ， 因 为 大 量 没有 被 服务 到 的 小 微 群 
体 数量 非常 庞大 ， 而 服务 却 没有 跟 上 。 

传统 征 信 基本 上 对 接 大 额 借贷 客户 居多 ， 对 小 额 借 贷 不 居 一 顾 ， 除 了 信息 不 全 面 问 
题 ， 也 有 经 济 成 本 问题 。 而 互联 网 的 出 现 使 得 细 分 市 场 被 挖掘， 而 大 数据 征 信 又 更 加 针对 
分 析 这 部 分 小 微 群体 的 行为 痕迹 特征 。 这 部 分 群体 数量 非常 大 但 单 笔 借款 可 能 比较 微小 ， 
但 是 乘积 总 和 不 可 小 规 。 这 就 是 长 尾 理论 支持 的 海量 不 被 传统 机 构 重 视 的 需求 得 以 被 挖掘 
和 满足 ， 而 大 数据 征 信 正 契合 这 点 。 

2. 大 数据 征 信 的 管理 学 理论 

1) “数据 挖掘 理论 

在 海量 数据 时 代 ， 征 信 系 统 需要 利用 数据 挖掘 技术 对 庞大 数据 进行 提取 分 析 ， 建 立信 
用 评分 模型 ， 从 而 运用 到 经 济 活动 的 各 个 环节 中 去 。 数 据 挖掘 是 一 个 交叉 学 科 ， 涵 盖 了 数 
学 、 统 计 学 、 机 器 学 习 、 数 据 存储 、AI 和 高 性 能 计算 等 多 个 学 科 。 它 需要 有 专业 性 人 才 参 
与 发 现 大 数据 中 有 意义 的 模式 与 规律 。 
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所 以 ， 建 立 健康 的 大 数据 征 信 体系 的 前 提 之 一 ， 是 将 其 核心 技术 数据 挖掘 完善 起 来 。 

2) ”信息 加 工 理论 

信息 加 工 理论 是 因为 问题 解决 和 决策 制定 阶段 时 接收 、 理 解 、 存 储 、 使 用 信息 的 机 制 
而 成 型 的 理论 。 当 整个 社会 的 企业 与 个 人 信息 需要 录入 征 信 系统 中 时 ， 就 需要 信息 的 
加 工 


整个 征 信 过 程 是 信息 从 接收 到 利用 的 过 程 ， 大 数据 征 信 对 信息 加 工 更 加 频繁 。 

传统 征 信 的 产生 并 不 在 互联 网 大 数据 等 技术 普及 的 时 代 。 互 联网 和 电子 设备 似乎 已 经 
成 为 人 们 的 日 常 必 备 品 ， 从 而 在 这 些 基础 设施 上 留 下 了 人 们 的 行为 痕迹 。 现 代 科 技 的 进步 
使 得 信息 计算 处 理 技术 进入 更 高 的 层次 ， 大 数据 征 信 离 不 开 数据 挖掘 和 信息 加 工 ， 这 都 是 
对 数据 在 技术 上 的 处 理 高 地 。 没 有 这 些 方面 的 支持 ， 大 数据 也 出 现 不 了 ， 自 然 也 没有 “大 
数据 + 征 信 ”产生 ， 所 以 这 两 者 也 是 与 经 济 学 理论 的 信息 经 济 学 和 交易 费用 理论 一 样 ， 是 
大 数据 产生 的 关键 原因 。 

3) ”政府 管制 理论 

为 了 维护 、 达 到 特定 公共 利益 ， 政 府 可 以 出 面 进行 管理 和 制约 ， 这 称 为 政府 管制 。 政 
府 管制 的 措施 主要 有 审批 、 发 放 牌 照 、 对 企业 限定 经 营 范围 等 。 有 政府 管制 力量 的 介入 可 
以 维持 一 部 分 特定 市 场 的 行为 。 

由 于 征 信 机 构 牵 涉 众多 个 人 或 企业 的 利益 ， 所 以 征 信 系 统 对 政府 管制 的 需求 是 双向 
的 。 一 方面 ， 整 个 征 信 体系 需要 政府 的 监督 与 管理 ， 另 一 方面 ， 征 信行 业 也 会 谨防 管制 过 
度 而 阻碍 整体 的 发 展 。 作 为 征 信 系统 的 一 部 分 ， 大 数据 征 信 对 政府 管制 的 应 用 与 实践 和 传 
统 征 信 亦 一 样 。 

大 数据 既然 能 采集 挖掘 人 们 各 方面 的 特征 ， 自 然 这 些 数 据 就 有 价值 ， 价 值 带 来 两 方面 
结果 ， 一 面 是 好 ， 一 面 是 坏 ， 好 的 一 面 就 是 促进 经 济 发 展 带 来 普 惠 ， 而 坏 的 一 面 就 会 导致 
数据 被 滥用 ， 隐 私 被 泄露 ， 使 被 征 信和 主体 可 能 遭受 经 济 甚至 其 他 损失 。 这 些 都 与 利益 有 
关 ， 那 么 就 要 进行 法 律 法 规制 约 ， 所 以 政府 管制 的 角色 作用 就 体现 了 ， 必 须 制 定 公平 合理 
的 监管 措施 。 大 数据 和 征 信 相关 的 行业 法 规 的 出 台 是 必需 的 。 

3. 大 数据 征 信 的 社会 科学 理论 

大 数据 征 信 不 仅 是 涉及 经 济 学 或 信息 学 的 某 一 学 科 ， 同 时 还 需要 结合 社会 科学 原理 。 
心理 学 认为 信用 是 指 信任 和 安全 感 ， 是 一 种 心理 现象 。 伦 理学 中 的 信用 是 处 理 人 际 关系 应 
当 遵循 的 基本 道德 。 

安全 感 和 信任 感 某 种 程度 上 来 自 一 方 对 另 一 方 的 信任 ， 信 任 是 非常 重要 的 东西 ， 信 任 
也 是 了 解 对 方 特征 以 后 做 出 的 认可 。 按 照 之 前 所 说 ， 大 数据 征 信 能 够 一 定 程度 地 刻画 出 一 
个 主体 的 特征 。 例 如 在 借贷 方面 ， 假 设 分 析 结论 是 对 方 有 意愿 和 能 力 还 款 ， 那 么 我 们 就 应 
该 予以 信任 把 资金 借 给 他 。 又 例如 在 交 朋 友 或 婚恋 方面 ， 如 果 知 道 对 方 的 信用 度 ， 产 生 的 
信任 感 会 提升 ， 因 为 认为 对 方 是 个 靠 谱 的 人 ， 这 也 将 一 定 程度 改善 人 际 关系 ， 这 点 也 可 以 
反 过 来 说 ， 维 护 人 际 关系 也 需要 提升 自己 的 靠 谱 度 。 而 大 数据 征 信 就 是 被 量化 的 信用 ， 满 
足 社会 对 信任 的 需要 。 

所 以 总 的 来 看 ， 大 数据 征 信 综 合 了 信息 经 济 学 、 交 易 费 用 理论 、 声 誉 理论 、 长 尾 理 
论 、 数 据 挖 掘 理论 、 信 息 加 工 理 论 、 政 府 管制 理论 以 及 社会 科学 理论 。 
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7.2.3 大 数据 征 信 流程 
征 信 大 数据 应 用 流程 如 图 7.12 所 示 。 


数据 质量 、 数 
隐私 保护 和 
> Jv Sd 
a 
| a 
大 数据 采集 大 数据 处 理 大 数据 分 析 大 数据 
和 挖 所 诚信 服务 


4 一 一 
图 7.12， 征 信 大 数据 应 用 流程 


征 信 机 构 最 基本 的 作用 就 是 将 分 散在 不 同 授信 机 构 的 碎片 化 的 局 部 信息 加 工 融合 成 为 
具有 完整 视图 效果 的 全 局 信息 ， 从 中 挖掘 出 风险 信息 ， 帮 助 解决 交易 过 程 中 的 信息 不 完整 
的 问题 ， 减 少 风险 ， 降 低 交 易 成 本 ， 帮 助 商业 机 构 更 加 有 效 地 进行 决策 。 大 数据 技术 有 助 
于 对 更 加 分 散 、 碎 片 化 、 底 层 的 数据 加 工 处 理 成 为 更 加 完整 的 全 局 信息 ， 更 加 有 效 地 减少 
这 种 信息 不 对 称 。 

类 比 于 矿物 加 工 提炼 过 程 ， 征 信 机 构 的 业务 流程 可 以 理解 为 将 征 信 数据 提炼 为 信用 信 
息 的 过 程 ， 包 括 数据 采集 (数据 可 以 理解 为 矿石 原材料 ， 数 据 采集 可 以 理解 为 挖 矿 ， 收 集 矿 
石原 材料 )、 数 据 处 理 (相当 于 矿石 粗 加 工 ， 去 杂 ， 粗 加 工 成 基本 原材料 )、 数 据 分 析 和 挖掘 
(矿石 深加工 ， 按 照 一 定 的 配方 ， 由 不 同 生产 线 批量 生产 出 不 同 的 生活 用 品 和 化 工 用 品 ) 以 
及 数据 服务 (对 产品 进行 质量 检查 ， 进 行 包装 ， 提 供给 各 种 终端 用 户 )。 

在 大 数据 时 代 ， 大 数据 技术 为 征 信 发 展 提供 了 新 的 图 景 。 大 数据 技术 可 以 媒 套 在 整个 
征 信 的 业务 流程 中 ， 同 时 可 以 根据 大 数据 服务 的 需求 ， 不 断 更 新 和 探索 新 的 大 数据 来 源 。 
此 外 ， 征 信 大 数据 的 处 理 流程 中 的 每 一 个 环节 都 要 兼顾 数据 质量 、 数 据 安全 、 消 费 者 隐私 
保护 和 监管 合 规 性 的 要 求 。 


(OWE 大 数据 征 信 典 型 企 


7.3.1 国外 大 数据 征 信和 典型 企业 
如 图 7.13 所 示 为 美国 征 信 体 系 。 
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7.13 ”美国 征 信 体 系 


美国 在 1920 年 前 后 征 信 体 系 即 基本 建立 。 目 前 ， 美 国 征 信 市 场 专业 分 工 已 非常 清 
晰 。 整 个 征 信 体系 分 为 机 构 征 信 和 个 人 征 信 。 

其 中 机 构 征 信 又 分 为 资本 市 场 信用 和 普通 企业 信用 。 资 本 市 场 信 用 机 构 包 括 Moody's、 
Standard & Poors、Fitch Ratings 等 ， 普 通 企业 信用 机 构 包 括 Dun & Bradstreet 等 。 

个 人 征 信 机 构 包 括 Experian、Equifax、Trans Union 等 。 此 外 ， 美 国 征 信 体 系 中 还 有 
400 多 家 区 域 性 或 专业 性 征 信 机 构 。 

如 图 7.14 所 示 为 美国 个 人 征 信 产 业 链 。 
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金融 机 构 金融 机 构 
和 授信 机 构 
第 三 方 数据 Metro 1 雇主 企业 
处 理 公 司 

& 数据 分 析 公 司 

公司 

Waa 公共 服务 机 构 
本 | 人 
自愿 提供 付费 使 用 


7.14 ”美国 个 人 征 信 产 业 链 


今 ， 美国 个 人 征 信 体 系 已 经 形成 成 熟 的 产业 链 ， 其 中 三 大 征 信和 局 及 相关 信用 产品 是 
体系 的 核心 ， 从 2000 年 至 今 已 形成 三 大 征 信 局 垄断 局 面 。 
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1. 全 联 (Trans Union) 


全 联 公司 是 美国 的 三 大 信用 局 之 一 ， 总 部 设 在 芝加哥 ， 自 1988 年 起 开始 提供 美国 全 
国 性 消费 者 信用 调查 报告 。 全 联 公司 数据 库 中 的 2.2 亿 消费 者 资料 ， 履 盖 北 美美 国 、 加 拿 
大 、 维 尔 京 群岛 和 波多 黎 各 。1990 年 ， 全 联 公司 已 经 拥有 45 家 地 区 性 信用 局 和 220 家 代 
办 处 。 

全 联 公司 向 全 世界 50 多 个 国家 提供 550 种 产品 和 服务 ， 信 用 报告 的 网 上 销售 每 年 已 
达 4 亿 次 ， 其 他 传统 方式 查询 更 达 150 亿 次 。 在 数据 的 采集 方面 ， 全 联 公司 拥有 7000 个 
数据 供应 机 构 ， 不 间断 地 向 它 提供 数据 ， 从 而 使 全 联 公司 有 能 力 、 有 资源 每 个 月 对 2.2 亿 
的 客户 资料 进行 12 次 数据 更 新 ， 每 次 更 新 涉及 20 亿 条 的 数据 档案 记录 。 庞 大 的 数据 加 工 
系统 ， 不 仅 是 对 计算 机 的 硬件 和 软件 的 考验 ， 也 是 对 个 人 信用 管理 公司 进行 客户 资料 保密 
手段 的 考验 。 

1) ”大 数据 采集 越 来 越 多 分 散 的 、 不 同 领 域 的 数据 源 

大 数据 为 征 信 活 动 提供 了 一 个 全 新 的 视角 ， 基 于 海量 的 、 多 样 的 、 交 叉 互 补 的 数据 ， 
征 信 机 构 可 以 获得 信用 主体 及 时 、 全 方位 的 信息 。 

全 联运 营 多 年 ， 已 经 建立 了 包含 信息 量 丰富 而 且 独 特 的 数据 源 。 全 联 目前 拥有 30PB 
数据 ， 包 括 金 融 数据 、 信 用 数据 、 可 蔡 代 数据 (包括 电信 预付 费 、 电 商 、 社 交 网 络 、 心 理 数 
据 等 )、 身 份 数据 、 破 产 数据 、 抵 押 物 数据 、 法 院 判决 数据 、 保 单数 据 、 汽 车 数据 以 及 从 近 
9000 个 数据 源 抽取 的 其 他 数据 ， 有 全 球 超过 10 亿 人 的 消费 者 客户 的 信息 ， 从 2010 年 开始 
以 超过 25% 的 速度 扩张 。 

全 联 的 大 数据 资产 ， 主 要 由 以 下 4 个 方面 组 成 。 

(1) 传统 的 信用 数据 。 

全 联 最 基础 的 数据 资产 是 信用 数据 库 ， 基 本 上 涵盖 了 所 有 美国 信用 活跃 (有 信用 交易 ) 
人 口 的 姓名 、 地 址 、 现 有 信用 关系 和 支付 债务 时 间 表 。 

该 数据 库 中 的 信息 是 由 成 千 上 万 的 信用 授予 机 构 和 数据 提供 商 自 愿 提供 的 ， 传 统 的 信 
用 数据 库 支撑 全 联 的 基础 的 征 信 业 务 。 

(2) 蔡 代 信 用 数据 。 

替代 信用 数据 是 指 除了 消费 者 信贷 数据 之 外 的 信用 交易 相关 数据 ， 可 以 在 消费 者 的 信 
贷 数 据 缺 失 的 情况 下 ， 代 蔡 作 为 消费 者 信用 描述 和 信用 评估 的 手段 ， 也 可 以 作为 一 种 增强 
信用 评估 的 方法 。 

替代 信用 渠道 (如 租赁 支付 和 公共 设施 支付 ) 拓 宽 了 传统 信用 数据 库 的 范围 。 例 如 ， 全 
联 拥有 巴西 最 大 的 替代 数据 库 ， 包 括 巴 西联 邦 税务 署 的 税务 记录 信息 等 上 百 个 数据 库 和 邮 
政 编码 (有 1.9 亿 个 人 和 2900 万 公司 数据 )。 

(3) 消费 者 公共 记录 。 

在 国内 央行 个 人 征 信 系 统 ， 蔡 代 信用 数据 和 消费 者 的 公共 记录 统称 为 非 银行 征 信 数 
据 。 全 联 从 法 庭 、 政 府 机 构 和 其 他 公共 记录 (如 诉讼 、 抵 押 、 判 决 、 破 产 、 专 业 许可 、 房 地 
产 、 车 辆 所 有 权 、 其 他 资产 、 违 规 驾 驶 、 犯 罪 记录 和 联络 信息 ) 中 获取 数据 。 

例如 ， 在 印度 可 以 获得 国家 选举 登记 处 (7.5 亿 记录 )、 国 家 ID 数据 库 ( 超 过 5 亿 记录 ) 的 
信息 。2013 年 12 月 ， 全 联 收购 了 TLO 公司 的 资产 (该 公司 利用 个 人 鉴定 、 欺 诈 保 护 和 债 
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务 找 回 的 公共 记录 数据 开发 了 数据 产品 )。2014 年 11 月 ， 全 联 收购 德国 DHI 公司 (交通 违 
纪 和 犯罪 审判 的 数据 提供 商 )。 在 南非 ， 全 联 获得 交通 设备 数据 库 ( 包 括 超过 1800 万 车 辆 记 
录 和 特殊 车 辆 识别 码 ， 是 南非 最 全 面 的 车 辆 数据 库 )。 

(4) 专 有 数据 库 。 

全 联 用 复杂 的 算法 生成 自己 专 有 的 数据 库 ， 提 人 炼 并 对 数据 进行 标准 化 。 这 些 数据 是 区 
别 于 其 他 竞争 对 手 的 ， 包 括 驾 驶 员 违章 记录 、 医 疗 资格 信息 、 商 业 数 据 和 房租 交付 信息 等 
信息 。 这 些 数据 库 更 准确 地 说 并 不 是 全 联 自己 生成 的 ， 而 是 和 其 他 机 构 合作 获取 的 ， 比 如 
房租 交付 信息 是 和 美国 一 家 房屋 租赁 公司 合作 而 取得 其 数据 的 。 

上 述 征 信 数 据 库 受到 监控 ， 定 期 更 新 、 复 核 。 全 联通 过 每 月 近 36 亿 条 记录 的 更 新 量 
来 保持 数据 的 鲜 活 度 。 全 联 在 选择 这 些 大 数据 时 ， 起 码 要 满足 以 下 标准 : @ 合 规 性 ， 满 足 
征 信 机 构 监 管 要 求 ( 包 括 信息 安全 和 消费 者 个 人 隐私 方面 的 规定 )，@ 数 据 是 活 数据 ， 可 以 
及 时 更 新 ，@@ 数 据 是 可 以 信赖 的 数据 ， 从 可 靠 的 、 具 有 公信 力 的 数据 源 获得 ;，@ 数 据 质量 
要 保证 数据 能 够 正常 使 用 。 此 外 征 信 机 构 的 数据 或 信息 在 被 商业 机 构 使 用 的 时 候 常 常 要 和 
本 地 的 大 数据 做 进一步 的 整合 才能 更 好 发 挥 作用 。 

2) ”大 数据 处 理 ， 强大 的 匹配 连接 能 力 和 下 一 代 技 术 

征 信 数 据 规模 变 大 ， 更 新 加 快 ， 类 型 复杂 ， 需 要 有 别 于 传统 工具 的 新 技术 方法 来 完成 
数据 处 理 和 分 析 任 务 。 

全 联 有 以 下 大 数据 处 理 能 力 。 

(1) 基础 大 数据 技术 。 

全 联 自主 研发 了 基础 征 信 大 数据 技术 ， 这 为 快速 执行 全 联 的 应 用 和 解决 方案 的 更 新 提 
供 了 灵活 性 。 

全 联 目前 已 经 利用 Ab Initio( 大 数据 处 理 软件 平台 技术 )、Hadoop( 开 源 分 布 系统 的 基础 
架构 ， 适 合 处 理 超大 量 的 数据 )、Netezze(IBM 基于 数据 仓库 的 分 析 技 术 ) 和 其 他 一 些 大 数据 
分 析 和 可 视 化 技术 来 应 对 海量 的 数据 (30PB)、 分 散 的 数据 源 (90 000 个 数据 源 ) 和 不 同 的 数 
据 格式 (超过 4000 多 种 数据 格式 )。 

全 联 的 大 数据 技术 可 以 处 理 、 组 织 和 分 析 跨 越 多 个 运行 系统 、 数 据 库 和 文件 类 型 的 海 
量 数据 ， 同 时 处 理 快 速 变化 的 结构 化 和 非 结构 化 数据 ， 加 上 每 天 数 十 亿 的 交易 和 数 以 兆 计 
的 数据 交换 。 全 联 的 大 数据 技术 提供 了 高 度 的 适应 性 ， 高 效率 和 客户 定制 化 ， 对 于 全 联 的 
解决 方案 ， 配 合 一 些 专业 技术 (如 图 形 化 开发 和 业务 规则 环境 )， 可 以 方便 地 和 客户 的 工作 
流程 整合 起 来 。 

(2) 增强 的 数据 匹配 连接 能 力 。 

大 数据 的 商业 价值 实现 关键 技术 之 一 就 是 匹配 、 连 接 和 整合 不 同类 型 、 不 同 来 源 的 数 
据 ， 其 原理 如 下 : 首先 找到 多 个 数据 源 中 信息 对 应 的 消费 者 ， 然 后 匹配 消费 者 具体 的 信息 
项 ， 将 可 能 存在 元 余 的 信息 项 进行 合并 或 剪裁 ， 得 到 消费 者 的 全 面 、 统 一 的 视图 。 

全 联 的 数据 匹配 技术 能 够 整合 多 个 数据 源 ， 连 接 多 种 信息 ， 产 生 新 的 数据 集 ， 更 好 地 
评估 风险 和 进行 数据 挖掘 。 

例如 ， 全 联 TLOxp 解决 方案 利用 数据 匹配 能 力 (来 自 不 同 数据 源 ) 来 确认 和 调查 不 同人 
之 间 、 资 产 之 间 、 位 置 之 间 和 业务 之 间 的 关系 ， 提 供 尽 职 调查 、 威 胁 评估 、 身 份 验证 、 坎 
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诈 预 防 和 检测 的 解决 方案 。 在 巴西 ， 全 联 利 用 数据 匹配 技术 连通 巴西 联邦 税务 署 (税务 记录 
信息 ) 等 上 百 个 公共 数据 库 和 邮政 编码 。 在 印度 ， 全 联 可 以 获得 征 信 机 构 CIBIL[Credit 
Information Bureau (India) Limited] 的 消费 者 风险 信息 ， 该 信用 数据 库 包 括 超过 2 亿 的 个 人 
消费 者 和 超过 1000 万 的 企业 主体 的 信息 。 

(3) 下 一 代 技 术 。 

全 联 正在 投入 研发 以 大 数据 为 特征 的 下 一 代 征 信 技术 ， 希 望 通过 下 一 代 技 术 的 转型 继 
续 提 供 面向 企业 和 消费 者 的 服务 ， 使 得 数据 吞吐 量 增加 ， 数 据 匹 配 能 力 提高 ， 有 较 高 的 适 
应 能 力 和 较 低 的 运营 成 本 、 更 高 的 效率 ， 保 证 更 快 的 市 场 响应 ， 可 以 实现 使 数据 建 档 、 数 
据 清 洗 、 数 据 入 库 的 速率 提高 10 倍 ， 并 由 非 I 人 员 自 助 完 成 ， 大 幅度 降低 新 产品 的 生产 
周期 


(4) 新 技术 探索 。 
近期 ， 全 联 和 南非 一 家 高 科技 公司 共同 筹建 南非 国家 声 纹 库 ， 研 发 声 纹 识别 技术 进行 
消费 者 身份 识别 和 反 欺 诈 。 据 称 ， 这 种 基于 声 纹 技 术 的 身份 验证 技术 比 传 统 基于 知识 (也 称 
为 “钱包 外 问题 ”) 验 证 消费 者 身份 方法 效率 高 80%。 全 联 对 生物 识别 的 前 沿 探索 目前 还 处 
于 早期 的 研发 阶段 。 

3) ”大 数据 挖掘 和 分 析 : 挖掘 潜在 信息 和 模式 ， 释 放大 数据 价值 

征 信 机 构 早 期 的 征 信 数据 挖掘 外 包 给 费 埃 哲 公司 (FICO)， 最 成 功 的 案例 是 FICO 信用 
评分 。 随 着 数据 分 析 技 术 的 提高 和 普及 ， 全 联 和 其 他 几 家 征 信 机 构 开始 建立 自己 的 分 析 师 
队伍 ， 开 发 自己 的 评分 产品 。 但 是 由 于 历史 传统 的 原因 ， 征 信 机 构 还 和 FICO 公司 继续 合 
作 ， 向 商业 机 构 提 供 信 用 评分 服务 。 具 体 来 说 ， 全 联 和 FICO 的 合作 只 是 在 某 些 国家 ， 如 
美国 和 加 拿 大 。 但 在 其 他 国家 和 地 区 ， 如 中 国 香港 、 南 非 ， 全 联 提供 的 所 有 包括 信用 风险 
分 数 在 内 的 产品 都 是 由 全 联 自主 开发 的 。 

理论 上 讲 ， 信 息 更 多 可 以 提供 更 好 的 风险 评估 ; 但 在 实际 操作 中 ， 随 着 平台 的 多 样 
化 、 商 业 模式 多 元 化 的 不 断 深入 ， 商 业 实 体 之 间 关 联 性 的 加 强 ， 风 险 和 商业 机 会 的 复杂 性 
也 在 不 断 增加 。 大 数据 技术 可 以 在 消费 者 或 信贷 产品 (组 合 ) 水 平 上 进行 风险 测量 和 管理 ， 
使 信用 审批 和 定价 更 加 精确 。《 经 济 学 人 》 曾 对 大 数据 在 金融 风险 方面 应 用 做 过 调查 ， 其 
中 大 数据 在 防范 信用 卡 欺诈 和 减少 违约 率 方面 效果 最 好 。 全 联 利用 大 数据 分 析 技 术 解 决 来 
自 多 个 信息 渠道 、 复 杂 海 量 的 信息 处 理 问 题 ， 提 高 风险 模型 的 预测 能 力 和 稳定 性 ， 以 及 实 
时 响应 速度 ， 帮 助 它 的 顾客 在 信用 和 风险 管理 中 做 出 及 时 的 决策 。 

为 了 充分 释放 征 信 大 数据 的 价值 ， 全 联 已 经 通过 在 技术 、 工 具 和 人 力 资源 方面 的 投入 
来 研发 复杂 和 灵活 的 分 析 和 决策 能 力 。 

(1) 开发 新 的 分 析 技 术 。 

全 联 的 分 析 师 利用 下 一 代 技 术 和 数据 匹配 能 力 实时 读 取 来 自 不 同 数据 源 的 数据 并 分 析 
这 些 数据 。 一 般 来 说 ， 分 析 师 配备 有 不 同 的 建 模 和 分 析 工 具 箱 (例如 可 视 化 和 机 器 学 习 )， 
目标 能 够 在 一 天 之 内 利用 自 服 务 的 数据 接口 产生 模型 开发 、 模 型 验证 和 用 于 客户 分 析 的 数 
据 样本 。 例 如 利用 大 数据 分 析 工 具 ， 全 联 Credit-Vision 解决 方案 中 对 一 个 新 的 贷款 组 合 建 
模 ， 只 需要 不 到 1 天 的 时 间 ， 而 传统 工具 和 技术 则 需要 开发 4~5 周 。 
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(2) 分 析 团 队 。 

在 大 数据 时 代 、 征 信 业 发 展 涉及 海量 数据 的 存储 、 加 工 、 处 理 、 分 析 ， 需 要 大 量 的 经 
济 学、 数学 、 计 算 机 等 各 类 型 的 高 级 综合 型 专业 人 才 。 全 联 拥有 经 验 丰富 的 分 析 团队 (一 般 
都 是 高 级 专业 人 士 或 者 是 博士 学 位 获得 者 )， 拥 有 大 量 的 行业 经 验 并 且 对 消费 者 信用 数据 有 
着 深厚 的 知识 储备 。 

(3) 研发 分 析 工 具 。 

数据 分 析 工具 是 挖掘 和 分 析 征 信 数 据 的 通用 的 基础 软件 组 件 。 全 联 开发 的 分 析 工 具 包 
括 基本 预测 模型 和 评分 、 消 费 者 细 分 、 业 务 标杆 比较 、 欺 诈 建 模 、 运 营 最 优化 等 ， 能 够 满 
足 特 定 的 客户 需求 。 

4) ”大 数据 服务 ， 丰富 多 元 化 的 数据 产品 、 个 性 化 的 服务 

征 信 大 数据 使 提供 更 多 的 信息 服务 、 面 向 更 多 领域 成 为 可 能 ， 大 数据 之 间 的 交叉 融合 
拓宽 了 征 信 产 品 和 服务 的 广度 和 深度 。 全 联通 过 提供 综合 的 数据 ， 先 进 的 分 析 技 术 和 决策 
能 力 的 服务 ， 帮 助 客户 提高 效率 、 管 理 风险 、 降 低 成 本 和 增加 收入 。 大 数据 使 全 联 征 信 产 
品 更 加 丰富 、 多 元 、 及 时 和 动态 化 ， 考 虑 不 同 客户 群体 的 细 分 需求 ， 提 供 更 加 个 性 化 、 客 
户 体验 更 好 的 征 信 信 息 服 务 。 大 数据 使 全 联 的 服务 范围 更 广阔 ， 从 面向 金融 服务 业 转 向 在 
保险 、 汽 车 、 医 疗 护理 、 电 信 、 和 零售 、 出 租 审查 、 消 费 和 法 律 执行 等 经 济 和 社会 领域 帮助 
顾客 做 出 关于 信用 和 风险 管理 的 及 时 决策 。 

基于 特别 的 数据 资源 、 分 析 和 决策 服务 ， 全 联 近期 研发 的 征 信 大 数据 产品 和 服务 示例 
如 下 。 

(1) 面向 金融 机 构 的 征 信 产品 Credit-Vision。 

不 同 于 传统 的 个 人 信用 报告 只 提供 当月 时 点 数据 的 服务 ， 该 产品 基于 30 个 月 的 时 间 
序列 数据 ， 向 金融 机 构 客户 提供 个 人 消费 者 风险 随时 间 变 化 的 速度 和 严重 程度 ， 更 精确 地 
划分 了 风险 。 其 和 传统 的 信用 分 析 产 品 的 最 重要 区 别 在 于 它 利 用 的 不 仅仅 是 当月 的 数据 ， 
而 且 是 包括 过 去 30 个 月 的 数据 ， 因 此 对 顾客 信用 各 个 方面 的 预测 性 更 为 准确 。 

(2) 面向 保险 公司 的 征 信 产品 Driver-Risk。 

整合 至 少 3 年 的 司机 驾驶 的 违规 记录 和 其 他 大 数据 ， 高 效 地 识别 司机 违规 的 可 能 性 ， 
从 独特 的 视角 来 考察 司机 风险 ， 降 低 保险 公司 的 成 本 。 

(3) 面向 商业 机 构 的 市 场 营销 产品 Ad-Surety。 

基于 全 联 自身 的 大 数据 ， 利 用 O20( 互 联网 数据 和 数据 库 数 据 ) 匹 配 技术 ， 帮 助 机 构 用 
户 从 包含 1 亿 3500 万 美国 消费 者 网 络 中 识别 潜在 顾客 ， 显 示 其 个 人 信息 并 且 测 算 效 果 ， 
增加 了 找到 目标 顾客 的 可 能 性 。 

(4) 面向 商业 机 构 用 户 的 决策 分 析 产 品 Decision-Edge。 

这 是 一 款 软件 即 服务 的 产品 ， 允 许 商 业 机 构 客户 在 和 消费 者 交互 情况 下 识别 并 验证 消 
费 者 用 户 ， 对 数据 和 预测 模型 的 结果 进行 解释 ， 根 据 机 构 客 户 定义 的 消费 者 标准 帮助 实现 
实时 和 自动 化 的 决策 。 

全 联 的 大 数据 技术 的 应 用 是 一 个 综合 性 过 程 ， 是 从 数据 采集 、 数 据 处 理 、 数 据 分 析 与 
挖掘 到 服务 的 一 个 一 体 化 的 过 程 。 随 着 业务 的 发 展 ， 今 后 全 联 的 征 信 大 数据 增长 主要 从 两 
个 维度 延伸 : 海外 征 信 业 务 的 发 展 增加 消费 者 的 数目 ， 数据 源 的 不 断 扩充 并 快速 增加 消费 
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者 的 信用 描述 。 

目前 全 联 的 大 数据 是 以 结构 化 数据 为 主 ， 基 本 不 涉及 社交 网 络 、 微 博 、 论 坛 、 互 联网 
行为 数据 等 非 结 构 化 数据 ， 当 然 这 一 方面 与 美国 的 数据 专业 化 运营 和 数据 开放 的 大 环境 有 
关 ， 另 外 一 个 重要 的 原因 在 于 ， 世 界 本 质 上 是 结构 化 的 ， 风 险 和 商业 信息 首先 主要 隐 含 在 
结构 化 的 数据 中 。 因 此 ， 征 信 大 数据 的 研发 应 首先 解决 好 结构 化 大 数据 的 处 理 和 分 析 问 
题 ， 挖 掘 出 主要 的 风险 和 商业 信息 。 虽 然 和 国内 流行 大 数据 征 信 比 较 起 来 略 显 保守 ， 但 是 
由 于 其 深厚 的 数据 资产 和 征 信 技 术 的 积累 ， 全 联 对 大 数据 技术 的 应 用 整体 来 看 是 一 个 自然 
的 过 程 ， 根 据 数据 信用 相关 性 逐步 扩张 ， 目 前 已 经 开始 研发 以 声 纹 为 代表 的 生物 识别 等 这 
些 未 来 和 征 信 相 关 的 大 数据 。 

虽然 大 数据 技术 给 全 球 个 人 征 信 机 构 (如 全 联 ) 带 来 了 很 多 变化 ， 如 数据 量 的 增 大 、 数 
据 类 型 的 增多 、 处 理 技术 的 提升 、 分 析 能 力 的 增强 、 服 务 范 围 扩 大 和 征 信 产 品 的 丰富 ， 但 
是 并 没有 给 这 些 征 信 机 构 带 来 业务 上 苏 覆 性 的 改变 ， 商 业 模 式 并 没有 发 生变 化 ， 主 要 商业 
内 容 还 是 从 基础 信用 信息 服务 、 市 场 营 销 、 决 策 分 析 到 消费 者 的 信用 管理 与 反 欺 诈 服务 
等 。 不 过 正如 每 一 次 数据 技术 的 突破 都 会 给 征 信 机 构 带 来 更 多 的 创新 和 颠覆 ， 例 如 数据 库 
技术 和 数据 挖掘 技术 ， 未 来 的 大 数据 技术 不 仅 会 延伸 以 全 联 为 代表 的 全 球 个 人 征 信 机 构 的 
信用 信息 服务 的 广度 和 深度 ， 而 且 未 来 有 可 能 会 带 来 一 些 商业 模式 上 的 变革 。 


2. ZestFinance 


ZestFinance， 原 名 ZestCash， 是 美国 一 家 新 兴 的 互联 网 金融 公司 ，2009 年 9 月 成 立 于 
洛杉矶 。ZestFinance 的 研发 团队 主要 由 数学 家 和 计算 机 科学 家 组 成 ， 前 期 的 业务 主要 通过 
ZestCash 平台 提供 放贷 服务 ， 后 来 专注 于 提供 信用 评估 服务 ， 旨 在 利用 大 数据 技术 重 塑 审 
贷 过 程 ， 为 难以 获得 传统 金融 服务 的 个 人 创造 可 用 的 信用 ， 降 低 他 们 的 借贷 成 本 。 

ZestFinance 起 初 是 为 传统 的 发 薪 日 贷款 (Payday Loans) 提 供 在 线 蔡 代 的 产品 。 发 薪 日 
贷款 因 借 款 人 承诺 在 发 薪 日 还 款 而 得 名 。 由 于 美国 传统 的 信用 风险 评估 体系 无 法 覆盖 全 部 
的 人 群 ， 大 约 15% 的 人 因 没 有 信用 评分 而 被 银行 排斥 在 外 ， 无 法 获得 基本 的 信贷 需求 。 

除了 解决 传统 信用 评估 体系 无 法 解决 的 无 信用 评分 借贷 问题 ，ZestFinance 还 主要 面向 
传统 信用 评估 解决 不 好 的 领域 ， 将 信用 分 数 低 而 借贷 成 本 高 的 人 群 视 为 服务 对 象 ， 利 用 大 
数据 技术 降低 他 们 的 信贷 成 本 。ZestFinance 目前 也 正在 向 信用 风险 管理 的 其 他 领域 纵深 扩 
展 。2014 年 ZestFinance 宣布 推出 基于 大 数据 分 析 的 收 债 评分 ， 旨 在 为 汽车 金融 、 学 生 贷 
款 、 医 疗 贷款 提供 一 种 新 的 评分 系统 。 

ZestFinance 的 基本 理念 是 认为 一 切 数据 都 是 和 信用 有 关 的 ， 在 能 够 获取 的 数据 中 尽 可 
能 地 挖掘 信用 信息 。ZestFinance 对 大 数据 技术 的 应 用 主要 从 大 数据 采集 和 大 数据 分 析 两 个 
层面 为 缺乏 信用 记录 的 人 挖掘 出 信用 。 

1) “大 数据 采集 技术 

ZestFinance 以 大 数据 技术 为 基础 采集 多 源 数据 ， 一 方面 继承 了 传统 征 信 体 系 的 决策 变 
量 ， 重 视 深 度 挖掘 授信 对 象 的 信贷 历史 。 另 一 方面 ， 将 能 够 影响 用 户 信 贷 水 平 的 其 他 因素 
也 考虑 在 内 ， 如 社交 网 络 信息 、 用 户 申请 信息 等 ， 从 而 实现 了 深度 和 广度 的 高 度 融 合 。 

ZestFinance 的 数据 来 源 十 分 丰富 ， 依 赖 于 结构 化 数据 的 同时 也 导入 了 大 量 的 非 结构 化 
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数据 。 另 外 ， 它 还 包括 大 量 的 非 传统 数据 ， 如 借款 人 的 房租 缴纳 记录 、 典 当 行 记录 、 网 络 

数据 信息 等 ， 甚 至 将 借款 人 填写 表格 时 使 用 大 小 写 的 习惯 、 在 线 提交 申请 之 前 是 否 阅读 文 

字 说 明 等 极 边缘 的 信息 作为 信用 评价 的 考量 因素 。 类 似 地 ， 非 常规 数据 是 客观 世界 的 传 感 

器 ， 反 映 了 借款 人 真实 的 状态 ， 是 客户 真实 的 社会 网 络 的 映射 。 只 有 充分 考察 借款 人 借款 

行为 背后 的 线索 及 线索 间 的 关联 性 ， 才 能 提供 深度 、 有 效 的 数据 分 析 服 务 ， 降 低 贷 款 违 
如 图 7.15 所 示 ，ZestFinance 的 数据 来 源 的 多 元 化 体现 在 以 下 几 个 方面 。 


ee — 


搬家 次 数 


电话 账本 


征 信 户 提交 能 
大 数据 征 人 用 户 提交 的 数据 水 电 煤 气 账 单 


社交 网 络 


图 7.15 ZestFinance 的 大 数据 源 

(1) 对 于 ZestFinance 进行 信用 评估 最 重要 的 数据 还 是 通过 购买 或 者 交换 来 自 第 三 方 的 
数据 ， 既 包含 银行 和 信用 卡 数据 ， 也 包括 法 律 记录 、 搬 家 次 数 等 非 传统 数据 。 

(2) 网 络 数据 ， 如 下 地 址 、 浏 览 器 版 本 甚至 电脑 的 屏幕 分 辩 率 ， 这 些 数 据 可 以 挖掘 出 
用 户 的 位 置信 息 、 性 格 和 行为 特征 ， 有 利于 评估 信贷 风险 。 此 外 社交 网 络 数据 也 是 大 数据 
征 信 的 重要 数据 源 。 

(3) 直接 询问 用 户 。 为 了 证 明 自 己 的 还 款 能 力 ， 用 户 会 有 详细 、 准 确 回答 的 激励 ， 另 
外 用 户 还 会 提交 相关 的 公共 记录 的 凭证 ， 如 水 电气 账单 、 手 机 账单 等 。 

多 维度 的 征 信 大 数据 可 以 使 得 ZestFinance 能 够 不 完全 依赖 于 传统 的 征 信 体系 ， 对 个 人 
消费 者 从 不 同 的 角度 进行 描述 和 进一步 深入 地 量化 信用 评估 。 


240 


大 数据 征 信 症 二 7 章 


2) ”大 数据 分 析 模 型 

7.16 展示 了 ZestFinance 的 信用 评估 分 析 原 理 ， 融 合 多 源 信息 ， 采 用 了 先进 机 器 学 
习 的 预测 模型 和 集成 学 习 的 策略 ， 进 行 大 数据 挖掘 。 

首先 ， 数 千 种 来 源 于 第 三 方 (如 电话 账单 、 租 赁 历史 等 ) 和 借贷 者 的 原始 数据 将 被 输入 
系统 。 其 次 ， 寻 找 数据 间 的 关联 性 并 对 数据 进行 转换 。 再 次 ， 在 关联 性 的 基础 上 将 变量 重 
新 整合 成 较 大 的 测量 指标 ， 每 一 种 变量 反映 借款 人 的 某 一 方面 特点 ， 如 诈骗 概率 、 长 期 和 
短期 内 的 信用 风险 和 偿还 能 力 等 。 然 后 将 这 些 较 大 的 变量 输入 到 不 同 的 数据 分 析 模 型 中 
去 。 最 后 ， 将 每 一 个 模型 输出 的 结论 按照 模型 投票 的 原则 ， 形 成 最 终 的 信用 分 数 。 


国 ;考虑 成 

a 首先 考虑 成 千 上 万 种 © oo @? oo oo oo 原始 数据 
目 模型 清理 变量 关系 ， 转 换 变 

量 为 有 用 的 格式 08000p 0% oY,0, 转换 数据 
目 被 转换 变量 合并 到 元 变量 之 PY 

中 ， 措 绘 一 个 借贷 省 的 某 外 en 元 变量 

特定 方面 AAA 六 / 


加 元 变量 输入 到 不 同 的 模块 中 ， ©@O@®@ 模块 


每 一 个 模块 代表 一 种 “技能 ” 


目 每 一 个 模块 贡献 一 定 分 数 比 
例 ， 合 成 最 终 的 分 数 SCORE 合成 分 数 


7.16 ZestFinance 的 信用 评估 分 析 原 理 

其 中 ，ZestFinance 开发 了 10 个 基于 机 器 学 习 的 分 析 模型 ， 对 每 位 信贷 申请 人 的 超过 1 
万 条 数据 信息 进行 分 析 ， 并 得 出 超过 7 万 个 可 对 其 行为 做 出 测量 的 指标 ， 在 5 秒 钟 内 就 能 
全 部 完成 。 这 10 个 模型 以 如 下 的 方式 进行 投票 : 让 你 最 聪明 的 10 个 朋友 坐 在 一 张 桌子 
旁 ， 然 后 询问 他 们 对 某 一 件 事情 的 意见 。 这 种 机 制 的 决策 性 能 远 远 好 于 业界 的 平均 水 平 。 

如 表 7.2 所 示 ， 将 这 种 基于 大 数据 技术 的 信用 评估 体系 和 传统 信用 评估 体系 (以 美国 的 
征 信 体 系 为 例 ) 相 比 ， 发 现 主 要 的 区 别 有 以 下 几 个 方面 。 

表 7.2 ”传统 的 信用 风险 评估 体系 和 基于 大 数据 的 信用 评估 体系 的 比较 


传统 信用 风险 评估 体系 

代表 企业 | FICO 

服务 人 数 | 有 丰富 信贷 记录 的 人 群 ( 约 占 85%) 
数据 格式 | 结构 化 数据 

数据 类 型 | 信贷 数据 

理论 基础 | 逻辑 回归 


基于 大 数据 的 信用 风险 评估 体系 
ZestFinance 

缺乏 或 无 信贷 记录 的 人 群 ( 约 占 15%) 
结构 化 数据 + 非 结构 化 数据 

信贷 数据 、 网 络 数据 、 社 交 数 据 

机 器 学 习 

传统 数据 、 邮 箱 姓 名 、 填 表 习 惯 、 浏 览 
记录 等 网 络 行为 


变量 特征 | 还 款 记录 、 人 金额 、 贷 款 类 别 
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续 表 


传统 信用 风险 评估 体系 基于 大 数据 的 信用 风险 评估 体系 
加 _ 第 三 方 数据 (如 电话 费 账单 、 租 赁 历史 等 
数据 来 源 | 银行 提交 给 第 三 方 的 数据 和 银行 系统 内 数据 
和 借款 人 自身 提供 的 数据 


变量 个 数 | 不 到 50 条 (变量 库 400 一 1000) 


(1) 服务 的 人 群 。 新 的 信用 评估 体系 可 以 服务 没有 被 传统 征 信 体 系 覆 盖 的 人 群 ， 即 没 
有 征 信 记 录 的 人 群 (美国 的 征 信 体 系 能 够 覆盖 85% 的 人 群 ， 覆 盖 不 到 15% 的 人 群 )。 

(2) 数据 源 。 这 种 新 的 信用 风险 评估 体系 大 量 采 用 非 传统 的 信用 数据 ， 包 括 互联 网 上 
的 行为 数据 和 关系 数据 ， 传 统 的 信用 数据 (银行 信贷 数据 ) 的 比重 仅 占 到 了 40%， 甚 至 完全 
不 用 传统 的 信贷 信用 数据 进行 风险 评估 。 

(3) 关注 的 侧重 点 。 传 统 的 信用 评估 模型 更 关注 授信 对 象 的 历史 信息 ， 致 力 于 深度 挖 
掘 。 而 新 的 信用 评估 体系 更 看 重用 户 现在 的 信息 ， 致 力 于 横向 拓展 。 

(4) 信用 量化 评估 的 方式 。 新 的 信用 评估 体系 抛弃 了 只 用 很 少 变量 的 FICO 信用 评分 
模型 ， 基 于 大 数据 技术 ， 不 仅 采用 机 器 学 习 的 模型 ， 而 且 使 用 更 多 变量 ， 一 方面 可 以 使 信 
用 评估 的 决策 效率 提高 ， 另 一 方面 还 明显 降低 了 风险 违约 率 。 


7.3.2 ”国内 大 数据 征 信和 典型 企业 


1. 芝麻 信用 : 侧重 电 商 


蚂蚁 金 服 征 信 模式 的 运行 机 制 是 一 个 循环 过 程 ， 自 成 体系 。 其 运行 过 程 如 图 7.17 
所 示 。 


多 达 上 万 条 


融资 平台 理财 平台 保险 平台 
支付 平台 | 支 人 
网 商 银行 | 坟 付 结 和 
支付 宝 
交 


蚂蚁 小 贷 蚂蚁 聚宝 众 安 在 线 
客户 业务 数据 传递 


蚂蚁 花 巩 余额 宝 
企业 信用 报告 
芝麻 信用 分 


商 诚 担保 招 财宝 


图 7.17 蚂蚁 金 服 征 信 模 式 的 运行 机 制 
蚂蚁 金 服 旗下 拥有 四 大 平台 ， 即 支付 平台 、 融 资 平台 、 理 财 平 台 和 保险 平台 。 以 阿里 
巴巴 为 依托 ， 其 诚信 通 和 淘宝 中 个 人 和 企业 的 交易 数据 会 通过 支付 宝 收录 到 支付 平台 ， 
将 支付 数据 传递 输出 给 蚂蚁 金融 云 大 数据 库 。 融 资 、 理 财 、 保 险 三 大 平台 以 自身 的 客户 数 


庶 这 中兴 曾 
潮 窒 酒 订 
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据 为 基础 ， 一 方面 将 操作 过 程 中 的 客户 业务 数据 传递 到 蚂蚁 金融 云 大 数据 库 ， 另 一 方面 也 
会 通过 支付 平台 来 进行 支付 结算 ， 而 这 部 分 交易 数据 也 会 随同 支付 平台 输出 到 大 数据 库 。 
蚂蚁 金融 云 专注 于 云 计 算 领 域 大 数据 的 研究 和 研发 ， 可 以 把 各 行为 主体 纷繁 复杂 的 信息 数 
据 映射 为 其 自身 详细 的 信用 评价 ， 形 成 芝麻 信用 分 和 企业 信用 报告 。 

芝麻 信用 作为 蚂蚁 金 服 旗下 独立 的 第 三 方 征 信 机 构 ， 通 过 云 计算 、 机 器 学 习 等 技术 客 
观 呈现 个 人 的 信用 状况 ， 已 经 在 信用 卡 、 消 费 金融 、 融 资 租赁 、 酒 店 、 租 房 、 出 行 、 婚 
恋 、 分 类 信息 、 学 生 服 务 、 公 共事 业 服 务 等 上 百 个 场景 为 用 户 、 商 户 提供 信用 服务 。 

1) ”大 数据 来 源 

其 数据 主要 来 源 于 以 下 3 个 方面 。 

(1) 阿里 体系 内 的 数据 。 包 括 阿里 巴巴 体系 (淘宝 、 天 猫 ) 的 电 商 交易 数据 和 蚂蚁 金 服 
的 金融 数据 。 

(2) 外 部 合作 机 构 提供 的 数据 。 主 要 有 两 种 方式 ， 政 府 方面 的 数据 以 购买 方式 获取 为 
主 ， 包 括 工商 、 学 历 学 籍 部 门 、 法 院 、 公 安 、 电 力 、 煤 气 公 司 等 公共 事业 机 构 。 另 外 ， 一 
些 本 身 具 有 大 数据 积累 的 商业 公司 也 是 芝麻 信用 的 合作 对 象 ， 比 如 运营 商 、P2P 公司 等 ， 
这 部 分 通过 人 合作、 置换、 服务 输出 等 方式 获得 。 

(3) 用 户 自主 上 传 的 信用 数据 。 芝 麻 在 2015 年 7 月 上 线 了 上 传 功能 ， 用 户 可 以 主动 
上 传 个 人 信息 ， 包 括 学 历 学 籍 、 单 位 邮箱 、 职 业 信 息 、 车 辆 信息 和 公积金 5 个 方面 。 

目前 ， 芝 麻 信 用 带 有 购物 、 金 融和 社交 3 种 不 同 维度 的 数据 ， 其 接 入 的 外 部 数据 源 在 
八成 以 上 ， 而 阿里 的 数据 源 已 减少 至 不 足 两 成 。 

2) ”大 数据 处 理 技术 

芝麻 信用 在 构建 信用 评分 模型 体系 时 ， 利 用 云 计算 、 机 器 学 习 等 技术 ， 能 以 较 低 的 成 
本 对 海量 数据 的 关联 性 进行 分 析 ， 还 在 充分 研究 和 吸收 传统 征 信 评 分 模型 算法 的 优势 的 基 
础 上 ， 积 极 尝试 前 沿 的 随机 森林 、 决 策 树 、 神 经 网 络 等 模型 算法 ， 挖 掘 出 和 信用 表现 有 稳 
定 关 联 的 特征 ， 从 而 更 加 高 效 和 科学 地 发 现 大 数据 中 蕴含 的 信用 评估 价值 。 

目前 ， 芝 麻 信 用 应 用 了 一 种 改进 的 树 模 型 GBDT， 深 入 挖掘 特征 之 间 的 关联 性 ， 衍 生 
出 具备 较 强 信用 预测 能 力 的 组 合 特征 ， 并 将 该 组 合 特征 与 原始 特征 一 起 使 用 人 逻辑 回归 线性 
算法 进行 训练 ， 从 而 获得 一 个 具备 可 解释 性 的 准确 的 线性 预测 模型 。 

3) ”大 数据 产品 与 服务 

芝麻 信用 体系 包括 芝麻 信用 评分 、 信 用 报告 、 反 欺诈 、 行 业 关注 名 单 等 一 系列 信用 产 
品 ， 提 供 反 欺 诈 IVS 信息 验证 服务 (基于 实名 用 户 的 欺诈 风险 识别 ， 帮 助 提升 合作 伙伴 反 
欺诈 识别 能 力 )、 芝 麻 数 据 变量 服务 DAS( 还 原 用户 画 像 ， 个 性 化 的 策略 模型 )、 负 面 信息 披 
露 、 还 款 提醒 等 服务 。 

芝麻 信用 评分 即 芝麻 分 是 芝麻 信用 产品 中 的 核心 产品 ， 并 为 用 户 提供 信用 评分 服务 。 
芝麻 分 一 个 看 似 简单 的 分 数 ， 背 后 是 芝麻 信用 对 海量 信息 数据 的 综合 处 理 和 评估 。 

2015 年 1 月 芝麻 信用 开始 在 部 分 用 户 中 进行 公测 ， 并 推出 芝麻 信用 分 ， 这 是 我 国 首 
个 个 人 信用 评分 。 

芝麻 信用 分 与 国际 通行 的 信用 评分 类 似 ， 分 区 间 设 定 为 350 分 至 950 分 ， 分 数 越 高 
代表 信用 程度 越 好 ， 违 约 可 能 性 越 低 。 芝 麻 信 用 与 FICO 评分 区 别 如 表 7.3 所 示 。 
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表 7.3 ”芝麻 信用 分 与 FICO 评分 的 比较 


芝麻 信用 分 FICO 评分 
评分 区 间 | 350 一 950 分 300 一 850 分 
5 个 ， 包 括 信 用 偿还 历史 、 信 用 账户 数 、 
5 个 ， 包 括 信 用 历史 、 行 为 偏好 、 履 约 能 
评分 维度 六 os ed “| 信用 使 用 年 限 、 正 在 使 用 的 信用 类 型 、 
人 的 新 开 立 的 信用 账户 
具体 戈 级 ， 一 般 而 言 ， b 
由 低 到 高 划分 为 5 级 : 极 差 3530 一 550)、 中 TA 需 而 、 人 二 
评分 等 级 | 等 (550~600)、 良 好 (600~650)、 优 秀 (650~ 代表 信用 状况 卓著 ，620 分 以 下 代表 信用 
、 、 状况 极 差 ，620~680 之 间 ， 信 用 状况 还 
700)、 极 好 (700 一 950) 和 
需要 做 进一步 核查 
评分 结果 被 美国 三 大 个 人 征 信 机 构 
目前 在 与 芝麻 信用 开展 合作 的 商户 以 及 部 分 . 各 时 二 种 信和 构 采 
应 用 领域 个 人 消费 金融 领域 中 应 用 用 ， 广 泛 应 用 于 金融 、 通 信 、 公 共 服 
让 已 My 
务 、 日 常生 活 等 领域 


芝麻 分 综合 考虑 了 个 人 用 户 的 信用 历史 、 行 为 偏好 、 履 约 能 力 、 身 份 特质 、 人 脉 关系 
5 个 维度 的 信息 。 

(1) 信用 历史 。 过 往 信用 账户 还 款 记 录 及 信用 账户 历史 。 目 前 这 一 块 内 容 大 多 来 自 支 
付 宝 ， 特 别 是 支付 宝 转账 和 用 支付 宝 还 信用 卡 的 历史 。 

(2) 行为 偏好 。 在 购物 缴费、 转账、 理财 等 活动 中 的 偏好 及 稳定 性 。 比 如 一 个 人 每 
天 打 游 戏 10 小 时 ， 那 么 就 会 被 认为 是 无 所 事 事 ， 如 果 一 个 人 经 常 买 纸尿裤 ， 那 这 个 人 便 
被 认为 已 为 人 父母 ， 相 对 更 有 责任 心 。 

(3) 履约 能 力 。 包括 享 用 各 类 信用 服务 并 确保 及 时 履约 ， 例 如 租车 是 否 按时 归还 ， 水 
电 煤气 是 否 按时 交 费 等 。 

(身份 特质 。 在 使 用 相关 服务 过 程 中 留 下 的 足够 丰富 和 可 靠 的 个 人 基本 信息 。 包 括 
从 公安 、 学 历 学 籍 、 工 商 、 法 院 等 公共 部 门 获得 的 个 人 资料 ， 未 来 甚至 可 能 包括 根据 开车 
习惯、 项 击 键盘 速度 等 推测 出 的 个 人 性 格 。 

(5) 人 脉 关系 。 好 友 的 身份 特征 以 及 跟 好 友 互动 的 程度 。 根 据 “ 物 以 类 聚 人 以 群 分 ” 
的 理论 ， 通 过 转账 关系 、 校 友 关系 等 作为 评判 个 人 信用 的 依据 之 一 。 其 采用 的 人 脉 关系 、 
性 格 特征 等 新 型 变量 能 否 客观 反映 个 人 信用 ， 但 目前 还 没有 将 社交 聊天 内 容 、 点 赞 等 纳入 
参考 。 

2. 腾讯 征 信 : 侧重 电 商 

腾讯 征 信 是 首 批 经 人 民 银 行 批准 开展 征 信 业 务 的 机 构 之 一 ， 专 注 于 身份 识别 、 反 数 
诈 、 信 用 评估 服务 ， 帮 助 企业 控制 风险 、 远 离 炊 诈 、 挖 握 客 户 ， 切 实 推动 普 囊 金融 。 

1) 大 数据 来 源 

腾讯 征 信 依 托 于 腾讯 集团 ， 信 用 信息 主要 来 自 社交 、 游 戏 、 电 商 及 第 三 方 支付 平台 和 
合作 平台 。 其 中 主要 运用 社交 网 络 上 海量 信息 ， 比 如 在 线 、 财 产 、 消 费 、 社 交 等 情况 ， 为 
用 户 建立 基于 互联 网 信息 的 征 信 报 告 。 腾 讯 庞大 的 客户 群体 为 腾讯 征 信 提 供 了 海量 信息 。 

2) ”大 数据 处 理 与 分 析 
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腾讯 征 信 由 腾讯 旗下 财 付 通 团队 负责 ， 通 过 其 大 数据 平台 TDBANK， 在 不 同 数据 源 
中 ， 采 集 并 处 理 包括 即时 通信 、SNS、 电 商 交 易 、 虚 拟 消费 、 关 系 链 、 游 戏 行为 、 媒 体 行 
为 、 基 础 画像 等 数据 ， 运 用 统计 学 、 传 统 机 器 学 习 等 方法 综合 考察 用 户 的 消费 偏好 、 资 产 
构成 、 身 份 属 性 和 信用 历史 4 个 维度 ， 得 出 用 户 信用 评分 ， 为 用 户 建立 基于 互联 网 信息 的 
个 人 征 信 报 告 。 

3) ”大 数据 服务 

腾讯 征 信 业务 服务 的 对 象 主 要 包括 两 块 : 一 是 金融 机 构 ， 通 过 提供 互联 网 征 信 服务 来 
帮助 它们 降低 风险 ， 能 够 为 更 多 用 户 提供 金融 服务 ; 二 是 服务 普通 用 户 ， 用 很 便捷 的 方式 
帮 他 们 建立 信用 记录 ， 这 些 信用 记录 能 反 过 来 帮助 他 们 获得 更 多 的 金融 服务 。 

4) “大 数据 产品 

腾讯 征 信 的 征 信 产 品 主要 分 为 两 大 类 别 : 一 类 是 反 欺 诈 产 品 ， 另 一 类 是 信用 评级 产 
品 。 其 中 ， 反 欺诈 产品 包括 人 脸 识别 和 欺诈 评测 两 个 主要 的 应 用 场景 。 

(1) 人 脸 识别 产品 。 

腾讯 财 付 通 与 中 国 公 安 部 所 属 的 全 国 公民 身份 证 号 码 查 询 服务 中 心 ， 达 成 人 像 比 对 服 
务 的 战略 合作 。 公 民 身 份 证 查询 中 心 ， 拥 有 全 国 所 有 公民 的 户籍 信息 ， 拥 有 国内 最 权威 的 
身份 信息 数据 库 。 双 方 通过 深度 合作 ， 结 合 腾讯 独创 的 技术 算法 ， 大 力 提 升 人 脸 识别 的 准 
确 率 及 商业 应 用 可 用 性 ， 联 手 帮助 传统 金融 行业 解决 用 户 身 份 核实 、 反 欺诈 、 远 程 开户 等 


难题 。 
人 脸 识 别 系 统 主要 包括 几 个 部 分 ， 人 脸 图 像 采 集 及 人 脸 检 测 、 人 脸 特征 提取 ， 以 及 特 
征 相 似 度 匹 配 与 识别 。 


人 脸 识别 技术 能 够 应 用 的 关键 核心 在 于 以 下 3 点 。 

@ 图 像 识 别 核心 技术 。 

2015 年 1 月 ， 腾 讯 的 人 脸 识别 技术 正式 登场 亮相 。 腾 讯 对 人 脸 识别 研究 由 来 已 入， 其 
旗下 的 承担 人 脸 识 别 技术 研发 的 优 图 团队 ，2014 年 就 已 经 在 世界 权威 人 脸 检测 评测 集 
FDDB 上 达到 世界 第 一 水 平 ， 人 脸 识 别 LFW 数据 集 准确 率 超过 了 99.5%。 在 实际 业务 产品 
社交 网 络 图 像 上 的 准确 率 高 达 99%， 对 于 身份 证 照片 准确 率 甚至 超过 了 99.9%。 在 应 用 方 
面 ， 腾 讯 的 图 像 识 别 核心 技术 能 力 已 积累 了 独 有 的 优势 。 

@ 丰富 权威 的 样本 数据 库 。 

有 效 的 图 像样 本 库 包 括 各 类 生活 照 和 证 件 照 ， 这 是 提升 人 脸 识别 技术 的 必要 基础 。 

经 过 数 年 准备 ， 腾 讯 采 集 标注 了 海量 生活 照 训练 样本 数据 。 目 前 拥有 世界 上 最 大 的 黄 
种 人 人 脸 模 型 训练 样本 库 ， 非 常 适用 于 国内 环境 。 与 此 对 应 的 用 户 人 脸 识 别 技 术 上 已 经 有 
非常 深厚 的 储备 : 在 人 脸 检测 、 五 官 定 位 、 特 征 提取 和 特征 对 比 等 关键 步骤 上 ， 都 已 积累 
了 世界 顶尖 的 数据 模型 和 算法 。 

最 重要 的 证 件 照 是 身份 证 照片 。 腾 讯 财 付 通 与 公民 身份 证 查询 中 心 的 深度 合作 ， 大 力 
提升 人 脸 识别 的 准确 率 及 商业 应 用 可 用 性 。 与 其 他 几 家 公司 的 人 脸 识别 技术 不 同 的 是 ， 腾 
讯 推 出 的 人 脸 识 别 技术 产品 最 重要 的 环节 之 一 就 是 系统 将 用 户 的 视频 照 、 身 份 证 照片 跟 公 
民 身 份 证 查询 中 心 的 权威 数据 三 者 做 交叉 验证 ， 通 过 先进 的 算法 和 技术 进行 匹配 ， 杜 绝 假 
冒 身份 的 情况 出 现 。 

图 广泛 灵活 便捷 的 应 用 场景 。 
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传统 金融 中 ， 用 户 在 申请 银行 贷款 或 证 券 开户 时 ， 均 必须 到 实体 门店 上 做 身份 信息 核 
实 ， 完 成 面 签 。 如 今 ， 通 过 人 脸 识 别 技 术 ， 用 户 只 需要 打开 手机 摄像 头 ， 自 拍 一 张 照片 ， 
系统 将 会 做 一 个 活体 检测 ， 并 进行 一 系列 的 验证 、 匹 配 和 判定 ， 最 终 会 判断 这 个 照片 是 否 
是 用 户 本 人 操作 ， 完 成 身份 核实 。 

腾讯 与 微 众 银行 正在 对 金融 、 证 券 等 业务 进行 人 脸 识别 的 应 用 尝试 ， 相 信 不 久之 后 ， 
人 脸 识别 将 会 出 现在 更 多 的 应 用 场景 里 。 

(2) 反 坎 诈 核 查 产品 。 

腾讯 征 信 旗 下 对 公 业 务 产品 一 一 账户 级 反 欺诈 产品 已 经 开始 接 入 合作 机 构 ， 此 款 产品 
是 国内 首 个 利用 互联 网 数据 鉴别 欺诈 客户 的 产品 ， 主 要 服务 对 象 是 银行 、P2P、 小 贷 公 
司 、 保 险 等 机 构 。 能 帮助 企业 识别 用 户 身份 ， 发 现 恶意 或 者 疑似 欺诈 客户 ， 避 免 资金 损 
失 ， 支 持 国家 的 普 惠 金融 政策 。 

(3) 信用 评分 及 信用 报告 产品 。 

腾讯 信用 评分 及 报告 则 来 自 腾讯 社交 大 数据 优势 ， 全 面 覆盖 腾讯 生态 圈 8 亿 活跃 用 
户 ， 通 过 先进 大 数据 分 析 技 术 ， 准 确 量化 信用 风险 ， 有 效 提供 预测 准确 、 性 能 稳定 的 信用 
评分 体系 及 评估 报告 。 

对 于 个 人 用 户 不 但 可 以 查询 个 人 信用 报告 ， 还 可 以 提高 和 完善 自身 信用 情况 ， 形 成 良 
性 循环 ， 对 于 银行 等 商业 机 构 ， 该 信用 评分 体系 可 以 与 自 有 体系 形成 交叉 比 对 ， 帮 助 机 构 
更 准确 地 对 用 户 个 人 信用 做 出 判别 ， 挖 掘 更 多 价值 用 户 。 通 过 多 家 金融 机 构 实用 验证 证 
明 ， 腾 讯 信 用 评分 体系 预测 效果 适用 于 银行 ， 且 评分 性 能 稳定 。 

腾讯 信用 评分 主要 以 星 级 的 方式 展现 ， 共 7 颗 星 ， 亮 星 颗 数 越 多 表明 信用 评级 越 高 。 

星 级 主要 由 以 下 4 个 维度 构成 。 

@ 消费 。 用 户 在 微 信 、 手 机 QQ 支付 以 及 消费 偏好 。 

@@ 财富 。 在 腾讯 产品 内 各 资产 的 构成 、 理 财 记录 。 

@@ ”安全 。 财 付 通 账户 是 否 实名 认证 和 数字 认证 。 

@ 守 约 。 消 费 贷 款 、 信 用 卡 、 房 贷 是 否 按时 还 等 。 

3. 考 拉 征 信 : 针对 小 微 

考 拉 征 信 是 由 拉 卡 拉 联 合 多 家 知名 机 构 共 同 打 造 ， 作 为 独立 的 第 三 方 信用 评估 及 信用 
管理 机 构 ， 考 拉 征 信 已 同时 获得 了 央行 颁发 的 企业 征 信 牌 照 和 开展 个 人 征 信 业 务 资质 。 而 
拉 卡 拉 在 征 信 方 面 的 “ 抢 跑 ” 远 不 限于 牌照 一 一 考 拉 征 信 不 仅 拥 有 国内 首 个 专注 于 大 数据 
征 信和 模型 研究 的 专业 实验 室 ， 还 是 国内 首 家 征 信 产品 被 银行 接 入 的 征 信 机 构 。 

1) ”大 数据 来 源 

考 拉 征 信 有 着 独特 的 DNA， 拥 有 多 维度 的 数据 来 源 。 借 助 大 数据 技术 和 互联 网 平台 ， 
考 拉 征 信 汇 集 拉 卡 拉 10 年 积累 的 便民 、 电 商 和 金融 数据 ， 以 及 亿 级 个 人 用 户 和 数 百 万 线 
下 商户 的 日 常 经 营 数据 。 此 外 ， 蓝 色光 标 、 拓 尔 思 、 梅 泰 诺 、 旋 极 、51job 等 股东 提供 的 
相关 数据 、 政 府 对 外 公开 发 布 的 公共 机 构 数据 ， 以 及 合作 伙伴 提供 的 个 人 及 商户 交易 数据 
也 同样 能 够 为 考 拉 征 信 提 供 有 力 的 支持 。 
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2) ”大 数据 产品 与 服务 

考 拉 征 信 现 已 成 功 推出 个 人 征 信 、 职 业 征 信 、 商 户 征 信 等 征 信 平 台 ， 为 用 户 提供 考 拉 
个 人 信用 分 、 商 户 信 用 分 等 系列 产品 ， 并 为 互联 网 金融 行业 提供 了 一 整套 信用 评估 体系 及 
信用 服务 。 目 前 ， 考 拉 征 信 业 务 已 涵盖 金融 、 民 生 、 购 物 、 租 车 、 租 房 、 交 友 等 领域 ， 与 
近 200 家 机 构 开展 了 合作 。 

其 中 ， 考 拉 商 户 信 用 分 是 国内 首 款 针对 小 微 金融 信贷 及 小 微 商户 领域 推出 的 征 信 产 
品 ， 针 对 性 地 解决 小 微 商户 贷款 难题 ， 反 映 真 实 、 整 合 和 实时 的 商户 运营 情况 。 依 托 详尽 
的 市 场 调研 和 信用 数据 验证 的 “商户 信用 分 ”， 考 拉 征 信 已 联合 光大 银行 推出 了 “ 信 乔 
卡 ”， 创 新 性 地 推出 了 以 “ 考 拉 商 户 分 ”换取 “信用 额度 ”的 金融 模式 。 基 于 “商户 信用 
分 ”， 小 微 商户 通过 考 拉 征 信 APP 一 键 申请 即 可 快速 获得 信用 额度 ， 这 一 创新 产品 为 急需 
资金 支持 的 小 微 商户 带 来 了 便利 ， 特 别 是 对 民生 领域 的 小 超市 、 小 百货 、 零 售 领域 的 商户 
提供 了 实 实在 在 的 融资 支持 。 

而 考 拉 个 人 信用 分 则 是 对 个 人 用 户 信息 进行 加 工 、 整 理 和 计算 后 得 出 的 信用 评分 ， 采 
用 国际 通行 的 信用 分 直观 表现 信用 水 平 高 低 。 分 数 的 范围 在 300 分 到 850 分 之 间 ， 分 数 越 
高 代表 信用 程度 越 好 。 此 外 ， 作 为 国内 首 个 开创 职业 征 信 平 台 的 征 信 机 构 ， 考 拉 征 信 深 刻 
理解 “职场 雾 玫 ”现状 和 人 才 管 理 痛 点 ， 运 用 大 数据 征 信 技 术 发 掘 分析， 可 为 企业 提供 即 
时 、 客 观 、 全 面 的 职业 征 信服 务 ， 帮 助 企 业 全 面 规避 人 才 管 理 风险 ， 提 高 人 力 资源 效率 。 

不 管 是 机 构 还 是 他 人 ， 要 查看 考 拉 分 ， 都 必须 获得 用 户 本 人 的 授权 。 信 用 评估 是 直接 
以 分 值 的 形式 呈现 ， 以 保护 个 人 的 具体 信用 信息 和 隐私 。 


4. 闪 银 : 基于 微 信 


北京 闪 银 奇异 科技 有 限 公 司 ， 成 立 于 2014 年 4 月 ， 是 中 国 第 一 家 互联 网 信用 评估 公 
司 。 其 开发 的 “Wecash 闪 银 ”( 产 品 于 2013 年 年 底 上 线 ) 是 国内 最 先进 的 大 数据 信用 评估 
系统 。 

闪 银 是 一 款 基 于 微 信 、 用 大 数据 方式 进行 信用 征集 ， 利 用 数据 分 析 技术 和 机 器 学 习 算 
法 ， 进 行 快速 授信 、 快 速 完成 个 人 小 额 贷款 的 产品 。 

1) ”大 数据 来 源 

主要 根据 用 户 在 社交 媒体 、SNS 社区 (如 微 信 、 微 博 、 人 人 网 等 ) 发 布 的 信息 ， 分 析 用 
户 在 互联 网 上 的 行为 轨迹 及 历史 信息 ， 并 结合 用 户 自主 提交 的 身份 信息 、 资 产 信 息 、 网 银 
流水 等 资料 ， 对 没有 资信 数据 和 借贷 记录 的 用 户 人 群 进行 信用 风险 评估 。 

2) ”大 数据 分 析 

社交 分 析 的 具体 过 程 如 下 。 

首先 分 析 微 博 、 人 人 、 微 信 朋 友 圈 的 社交 数据 ， 聚 合 形 成 对 个 人 背景 信息 、 社 交 活 跃 
度 、 社 交 密度 、 社 会 影响 力 的 评判 。 通 过 分 析 诸 如 “关注 的 人 ”“ 粉 丝 ”“ 发 布 内 容 常 用 
词 ” 等 信息 ，Wecash 能 大 体 判 断 出 一 个 用 户 的 职业 范围 以 及 社会 影响 力 等 因素 。 

再 结合 用 户 上 传 的 资产 信息 和 银行 流水 等 交叉 验证 。 用 户 添 加 其 微 信 公众 账号 
(bank 9 后 ， 可 直接 在 微 信 上 提交 社交 网 络 地 址 、 拍 照 上 传 必要 的 身份 信息 、 资 产 信息 、 
网 银 流 水 等 资料 ，Wecash 随后 通过 其 评估 模型 对 个 人 完成 信用 评级 ， 从 而 对 个 人 完成 最 快 
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15 分 钟 的 快速 授信 过 程 。 授 信 后 ， 提 款 、 还 款 的 功能 均 可 通过 微 信 完成 。 


这 一 过 程 通常 仅 需要 20 分 钟 。 
5. 51 信用 卡 : 侧重 信用 卡 


51 信用 卡 主要 是 基于 用 户 信用 卡 电子 账单 历史 分 析 、 电 商 及 社交 关系 强 交 叉 验 证 。 根 
据 用 户 的 信用 卡 数据 、 开 放 给 平台 的 电 商 数据 所 对 应 的 购买 行为 、 手 机 运营 商 的 通话 情 


况 、 登 记 信息 等 取得 多 维 信息 的 交叉 验证 ， 确 定 用 户 的 风险 等 级 以 及 是 否 贷款 给 该 有 


表 7.4 51 信用 卡 客户 风险 等 级 模型 


账单 表现 


授信 卡 数 大 于 3 张 ， 单 卡 
最 高 授信 额度 大 于 3 万 ， 

额度 使 用 率 小 于 50%， 还 
款 比 100%， 账 单 完整 度 
100%， 近 6 个 月 内 极 少 延 
沾 ， 近 3 个 月 内 利息 极 少 

银行 授信 卡 数 大 于 2 张 ， 

单 卡 最 高 授信 额度 (国有 大 
于 1 万 或 商业 大 于 3 万 )， 

额度 使 用 率 少 于 70%， 还 
款 比 大 于 70%， 上 账单 完整 
度 大 于 75%， 近 6 个 月 内 
较 少 延 滞 ， 近 3 个 月 内 利 
息 较 少 

银行 授信 卡 数 大 于 2 张 ， 

单 卡 最 高 授信 额度 (国有 大 
于 1 万 或 商业 大 于 3 万 )， 

额度 使 用 率 少 于 70%， 还 
款 比 大 于 70%， 账 单 完整 
度 大 于 75%， 近 6 个 月 内 
极 少 延 灌 ， 近 3 个 月 内 利 
息 极 少 


及 电话 号 码 与 
申请 人 预 留 号 
码 一 致 


面 联系 人 ， 
营 商 匹配 度 高 ， 
关键 联系 人 齐全 


近 4 个 月 有 效 通 
话 记 录 大 于 500| 使 用 收 货 姓名 
次 ， 通 讯 录 无 负 | 及 电话 号 码 与 


面 联系 人 ， 与 运 | 申请 人 预 留 号 | 


营 商 匹配 度 高 ， 
关键 联系 人 齐全 


近 4 个 月 有 效 通 
话 记 录 大 于 300 
次 ， 通 讯 录 负面 


有 户 ( 见 


表 7.4)。 

风险 等 级 | 账单 管理 时 间 
1 >18 个 月 

2 | 

加 el | 

4 >3 个 月 
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银行 授信 卡 数 大 于 1 张 ， 
单 卡 最 高 授信 额度 (国有 大 
于 0.5 万 或 商业 大 于 1 
万 )， 额 度 使 用 率 高 ， 还 款 
比 大 于 10%， 账 单 完整 度 
大 于 50%， 近 6 个 月 内 中 


等 延 滞 ， 近 3 个 月 内 利息 


中 等 


风险 等 级 | 账单 管理 时 间 账单 表现 


银行 授信 卡 数 大 于 1 张 ， 

单 卡 最 高 授信 额度 (国有 大 
于 0.5 万 或 商业 大 于 0.5 
5 二 1 周 万 )， 额 度 使 用 率 高 或 超额 
使 用 ， 账 单 完整 度 大 于 
50%， 近 6 个 月 内 较 多 延 
灌 ， 近 3 个 月 内 利息 较 高 


51 信用 卡 风险 等 级 由 5 个 维度 构成 。 

(1) 账单 管理 时 间 。 信 用 卡 有 效 存 续 时 间 越 长 ， 用 户 风险 越 低 。 

(2) 账单 表现 。 根 据 用 户 的 授信 卡 数 、 授 信 额 度 ， 以 及 还 款 比 和 账单 完整 度 判断 用 户 
的 还 款 能 力 和 诚信 程度 。 

(3) 手机 入 网 期 限 。 手 机 入 网 期 限 越 长 ， 用 户 风险 越 低 。 

(4) 运营 商 。 通 过 近 4 个 月 有 效 通 话 记 录 以 及 通讯 录 中 是 否 存在 负面 联系 人 判断 用 
户 自身 的 可 靠 程度 。 

(5) 淘宝 。 主 要 看 常用 收 货 姓名 及 电话 号 码 是 否 与 申请 人 预 留 号 码 一 致 。 


本 章 总 结 


@ 征 信 是 指 征 信 机 构 作 为 信用 交易 双方 之 外 的 独立 第 三 方 ， 收 集 、 整 理 、 保 存 、 加 

工 个 人 、 法 人 及 其 他 组 织 的 信用 信息 ， 以 在 一 定 程度 上 揭示 信息 主体 的 信用 风险 
状况 ， 协 助 授信 人 或 投资 人 进行 风险 管理 的 一 种 信息 服务 活动 。 简 言 之 ， 征 信 的 
本 质 就 是 为 授信 机 构 或 投资 人 的 决策 提供 信息 参考 ， 是 授信 人 或 投资 人 之 间 的 一 
种 信息 分 享 机 制 。 

e 征 信 有 六 个 方面 的 作用 ， 它 们 分 别 是 防范 信用 风险 ， 促 进 信贷 市 场 发 展 、 服 务 其 
他 授信 市 场 ， 提 高 履约 水 平 、 加 强 金融 监管 和 宏观 调控 ， 维 护 金融 稳定 、 服 务 其 
他 政府 部 门 ， 提 升 执法 效率 、 有 效 揭示 风险 ， 为 市 场 参与 各 方 提供 决策 依据 、 提 
高 社会 信用 意识 、 维 护 社会 稳定 。 

e@ 征 信 机 构 是 负责 管理 信用 信息 共享 的 机 构 ， 从 事 个 人 和 (或 ) 企 业 信用 信息 的 采 
集 、 加 工 处 理 ， 并 为 用 户 提供 信用 报告 和 其 他 基于 征 信 系 统 数据 的 增值 产品 。 从 
全 球 实践 来 看 ， 征 信 机 构 一 般 分 为 三 类 : 个 人 征 信 机 构 、 信 贷 登记 系统 和 企业 征 
信 机 构 。 

e@ 征 信 体 系 是 指 与 征 信 活 动 有 关 的 法 律 规章 、 组 织 机 构 、 市 场 管理 、 文 化 建设 、 宣 
传教 育 等 共同 构成 的 一 个 体系 。 征 信 体 系 的 主要 功能 是 为 信贷 市 场 服 务 ， 但 同时 
具有 较 强 的 外 延性 ， 还 向 商品 交易 市 场 和 劳动 力 市 场 提供 服务 。 在 实践 中 ， 征 信 
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体系 的 主要 参与 者 有 征 信 机 构 、 金 融 机 构 、 企 业 、 个 人 以 及 政府 。 征 信 体 系 模式 
主要 有 三 种 : 市 场 主导 型 模式 、 政 府 主导 型 模式 和 会 员 制 模 式 。 

e@ ”大 数据 征 信 和 是 指 运 用 大 数据 技术 重新 设计 征 信 评价 模型 和 算法 ， 通 过 多 维度 的 信 
用 信息 考察 ， 形 成 对 个 人 、 企 业 、 社 会 团体 的 信用 评价 。 大 数据 征 信 从 其 本 质 上 
来 看 是 将 大 数据 技术 应 用 到 征 信 活 动 中 ， 突 出 强调 的 是 处 理 数据 的 数量 大 、 刻 
画 信用 的 维度 广 、 信 用 状况 的 动态 呈现 、 交 互 性 等 特点 ， 本 质 上 仍然 是 对 信息 
的 采集 、 整 理 、 保 存 、 加 工 和 公布 。 


- 简 述 传统 征 信 的 四 大 原则 。 

- 传统 征 信 是 如 何 进行 分 类 的 ? 

- 请 从 理论 角度 冰 述 传统 征 信 的 作用 。 

. 请 简要 绘 出 传统 征 信 流 程 图 。 

- 简 述 目前 世界 上 存在 的 3 种 征 信 体 系 模式 。 

. 我 国 目前 的 征 信 体 系 模式 是 哪 一 种 ”并 阐述 从 何 处 做 此 判断 。 

. 简 述 我 国 征 信 体系 的 各 个 子 系统 之 间 是 如 何 协调 的 。 

. 大 数据 征 信 相 比 于 传统 征 信 有 哪些 优势 ? 

9. 简 述 大 数据 征 信 大 致 流程 。 

10. 你 认为 在 本 章 典型 案例 中 的 这 几 家 企业 的 核心 竞争 力 分 别 在 哪里 ? 如 果 现 在 你 要 


co 门店 内 上 mm 一 


创建 一 个 大 数据 征 信 企 业 ， 你 有 哪些 想法 ? 
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@ 理解 掌握 金融 信息 安全 的 内 @ 热 入 美国 金融 信息 安全 保障 


涵 、 特 征 及 重要 性 机 制 

@ 掌握 大 数据 对 金融 信息 安全 带 @ 掌握 我 国 金融 信息 安全 体系 的 
来 的 机 遇 与 挑战 构建 策略 

@ 了 解 我 国 金融 信息 安全 的 现状 
及 制约 因素 


继 云 计算 、 物 联网 被 发 明和 应 用 之 后 ， 大 数据 成 为 当前 信息 产业 的 又 一 大 技术 
创新 。 金 融 行业 的 大 数据 技术 创新 在 给 人 们 带 来 机 会 和 挑战 的 同时 也 对 现 有 的 金融 
信息 安全 保护 手段 提出 了 更 高 的 要 求 。 

本 章 首先 从 金融 信息 安全 的 含义 及 特征 属性 入 手 ， 进 而 阐述 金融 信息 安全 的 重 
要 性 。 其 次 ， 引 入 金融 大 数据 ， 简 要 描述 了 大 数据 给 金融 信息 安全 带 来 的 机 遇 及 挑 
战 。 再 次 ， 从 宏观 角度 讲述 了 我 国 金融 信息 安全 的 现状 及 制约 因素 。 最 后 ， 通 过 对 
美国 金融 信息 安全 保障 机 制 的 阐述 ， 明 确 了 我 国 金融 信息 安全 体系 构建 的 策略 。 
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(CO 金融 信息 安全 的 重要 性 
8.1.1 金融 信息 安全 的 含义 


言 息 安全 的 范围 非常 广泛 ， 从 国家 层面 讲 ， 信 息 安全 关系 到 国家 利益 和 安全 ， 从 组 织 
机 构 层 面 看 ， 信 息 安全 关系 到 组 织 的 信息 资产 和 商业 机 密 ， 关 系 到 机 构 的 正常 运作 和 持续 
发 展 ， 就 个 人 而 言 ， 信 息 安 全 是 个 人 隐私 保护 和 个 人 财产 安全 的 客观 要 求 。 

表 8.1 列举 了 业界 对 信息 安全 的 定义 。 国 际 标准 化 组 织 对 信息 安全 的 定义 更 具 通 
用 性 。 


表 8.1 信息 安全 的 概念 


为 数据 处 理 系统 建立 而 采取 的 技术 和 管理 的 安全 保护 。 保 护 计算 机 硬件 、 软 
件 、 数 据 不 因 偶然 或 恶意 的 原因 而 受到 破坏 、 更 改 、 泄 露 
对 信息 系统 以 及 使 用 、 存 储 和 传输 信息 的 硬件 的 保护 ， 是 所 采取 的 相关 政 
策 、 认 识 、 培 训 和 教育 以 及 技术 等 必要 手段 。 确 保存 储 或 传送 中 的 数据 不 被 
他 人 有 意 或 无 意 地 窃取 与 破坏 ， 包 括 : 信息 设施 及 环境 安全 ， 如 建筑 物 与 周 
遭 环境 的 安全 ;数据 安全 ， 确 保 数据 不 会 被 非法 入 侵 者 读 取 或 破坏 ， 程 序 安 
全 ， 重 视 软件 开发 过 程 的 品质 及 维护 ， 系 统 安全 ， 维 护 计算 机 系统 正常 动作 
在 既定 的 密级 条 件 下 ， 网 络 与 信息 系统 抵御 意外 事件 或 恶意 行为 的 能 力 。 这 
些 事件 和 行为 将 威胁 所 存储 或 传输 的 数据 以 及 经 由 这 些 网 络 和 系统 所 提供 服 
务 的 可 用 性 、 真 实 性 、 完 整 性 和 机 密 性 
确保 以 电磁 信号 为 主要 形式 ， 在 计算 机 网 络 系统 中 进行 获取 、 处 理 、 存 储 、 
传输 和 利用 的 信息 内 容 ， 在 各 个 物理 位 置 、 罗 辑 区 域 、 存 储 和 传输 介质 中 

处 于 动态 和 静态 过 程 中 的 机 密 性 、 完 整 性 、 可 用 性 、 可 审查 性 和 不 可 抵赖 
性 ， 与 人 、 网 络 、 环 境 有 关 的 技术 和 管理 规程 的 有 机 集合 
保护 信息 和 信息 系统 不 被 未 经 授权 的 访问 、 使 用 、 泄 露 、 修 改 和 破坏 ， 为 信 
息 和 信息 系统 提供 保密 性 、 完 整 性 、 可 用 性 、 可 控制 性 和 不 可 否认 性 


从 微观 角度 看 ， 信 息 安全 主要 是 指 信息 生产 、 加 工 、 传 播 、 采 集 、 处 理 直 至 提取 利用 
等 信息 传输 与 使 用 全 过 程 中 的 信息 资源 安全 。 信 息 安全 的 核心 是 信息 处 理 过 程 的 安全 、 信 
息 存 储 环境 的 安全 以 及 信息 传输 和 数据 交换 过 程 的 安全 这 3 个 方面 。 

从 宏观 角度 看 ， 信 息 安全 是 国家 的 信息 化 产业 能 力 ， 以 及 信息 技术 体系 能 够 抵御 外 来 
威胁 与 侵害 ， 强 调 的 是 全 面 信息 化 产生 的 信息 安全 问题 : 一 方面 ， 泛 指 信息 技术 和 信息 系 
统 发 展 的 安全 ;， 另 一 方面 ， 特 指 国 家 重要 信息 化 体系 (如 国家 金融 信息 系统 、 国 家 通信 信息 
系统 、 国 防 信息 系统 等 ) 的 安全 。 


国际 标准 化 组 织 (ISO) 


美国 国家 安全 电信 和 
信息 系统 安全 委员 会 
(NSTISSC) 


欧盟 信息 安全 评价 标 
准 组 织 (ITSEC) 
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随 着 网 络 技术 的 发 展 ， 信 息 安全 的 内 涵 已 经 发 展 为 信息 系统 运行 安全 、 数 据 信息 安全 
和 通信 网 络 安全 ， 包 括 物理 环境 安全 ， 软 件 、 硬 件 和 网 络 系统 安全 ， 信 息 保密 安全 ， 组 织 
和 个 人 隐私 安全 ， 信 息 系统 基础 设施 与 国家 信息 安全 。 

2. 金融 信息 安全 

金融 信息 安全 是 指 利 用 信息 通信 技术 或 者 金融 数据 信息 ， 对 金融 领域 实施 的 各 类 安全 
威胁 和 应 对 手段 。 金 融 信息 安全 可 能 成 为 国家 间 网 络 安全 对 抗 的 战场 。 金 融 信 息 安全 主要 
内 容 包括 数据 安全 、 运 行 安全 、 软 件 安全 和 物理 安全 。 

1) “数据 安全 

没有 数据 安全 就 没有 信息 安全 ， 数 据 安全 管理 必须 贯穿 数据 生命 周期 的 全 过 程 。 数 据 
安全 有 相互 对 立 的 两 方面 的 含义 : 一 是 数据 本 身 的 安全 ， 主 要 是 指 采用 现代 密码 算法 对 数 
据 进 行 主动 保护 ， 如 数据 保密 、 数 据 完 整 性 、 双 向 强身 份 认证 等 ， 二 是 数据 防护 的 安全 ， 
主要 是 采用 现代 信息 存储 手段 对 数据 进行 主动 防护 ， 如 通过 磁盘 阵列 、 数 据 备份 、 异 地 容 
灾 等 手段 保证 数据 的 安全 ， 数 据 安 全 是 一 种 主动 的 包含 措施 ， 数 据 本 身 的 安全 必须 基于 可 
靠 的 加 密 算法 与 安全 体系 ， 主 要 是 有 对 称 算法 与 公开 密 钥 密 码 体系 两 种 。 

金融 业务 的 数据 要 求 绝 对 安全 和 保密 。 用 户 基 本 信息 、 用 户 支付 信息 、 资 金 信息 、 
业务 处 理 信息 、 数 据 交换 信息 等 的 丢失 、 泄 露 和 算 改 都 会 使 金融 业 遭 受 不 可 估量 的 损失 。 
在 互联 网 这 样 一 个 开放 式 的 环境 中 ， 如 何 确保 数据 输入 和 传输 的 完整 性 、 安 全 性 和 可 靠 
性 ， 如 何 防止 对 数据 的 非法 算 改 ， 如 何 实 现 对 数据 非法 操作 的 监控 与 制止 是 互联 网 金融 业 
务 系统 需要 重点 解决 的 问题 。 

2014 年 ， 全 国 知名 票务 服务 公司 携程 旅行 网 被 曝 其 支付 日 志 存 在 漏洞 ， 用 户 银行 卡 信 
息 可 被 黑客 任意 读 取 。 这 一 事件 引发 大 量 用 户 更 换 信 用 卡 ， 给 社会 公众 造成 巨大 的 恐慌 ， 
也 对 相关 机 构 的 信誉 和 作为 互联 网 金融 主力 军 之 一 的 互联 网 支付 蒙 上 了 阴影 。 目 前 ， 很 多 
互联 网 金融 平台 整体 安全 技术 水 平 跟 其 业务 的 风险 不 匹配 ， 加 密 系统 和 传输 系统 安全 性 并 
不 完善 ， 缺 乏 专业 、 核 心 的 防范 黑客 攻击 技术 ， 一 旦 网 络 传输 系统 和 环境 被 攻破 ， 或 者 加 
密 算法 被 黑客 所 破解 ， 黑 客 就 会 乘虚 而 入 ， 就 会 导致 用 户 信息 泄露 、 恶 意 冒 充 投资 人 进行 
恶意 提现 、 大 型 DDoS 攻击 和 CC 攻击 ， 以 及 来 自 黑客 的 恶意 勒索 。 

2) ”运行 安全 

运行 安全 主要 是 指 金 融 各 个 信息 系统 能 够 正常 工作 ， 用 户 能 够 正常 访问 ， 系 统 之 间 的 
数据 交换 、 调 用 等 能 够 正常 运行 ， 避 免 出 现 运 行 不 稳定 、 系 统 被 攻击 等 现象 。 

3) ”软件 安全 

软件 安全 主要 是 指 互 联网 金融 系统 软件 以 及 各 个 主机 、 服 务 器 、 工 作 站 等 设备 中 运行 
的 软件 的 安全 ， 避 免 软 件 的 一 些 意外 崩溃 等 。 

4) ”物理 安全 

物理 安全 是 指 各 种 硬件 的 安全 ， 尽 可 能 地 减少 一 些 不 可 抗力 因素 的 影响 。 


8.1.2 金融 信息 安全 的 属性 特征 
金融 信息 安全 除了 具备 广义 信息 安全 的 通用 定义 和 特性 外 ， 还 具有 一 些 关键 属性 。 根 
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据 ISO/ITEC 27001: 2013 信息 安全 管理 体系 ， 结 合金 融 业 对 信息 安全 的 主要 需求 ， 金 融 信 
息 安 全 具有 9 个 关键 属性 ( 见 表 8.2)。 


表 8.2 ”金融 信息 安全 的 属性 特征 


金融 信息 安全 

和 属性 描述 

保障 信息 仅 为 那些 被 授权 使 用 的 人 所 获取 。 保 证 信息 不 被 非 授权 访问 ， 即 使 非 授权 
用 户 得 到 信息 也 无 法 知晓 信息 内 容 或 无 法 利用 信息 资源 
保证 数据 从 产生 、 传 输 到 接收 全 过 程 的 一 致 性 ， 防 止 数据 被 非法 算 改 。 涉 及 信息 合 

完整 性 用 、 传 输 、 存 储 物 过 程 中 不 发 生 算 改 、 丢 失 和 错误 ， 信 息 处 理 方法 正确 ， 不 会 对 原始 
信息 造成 破坏 

保障 授权 使 用 人 在 需要 时 可 以 获取 和 使 用 信息 。 保 证 合法 用 户 对 信息 和 资源 的 使 
用 ， 而 不 会 被 不 正当 地 拒绝 

真实 性 对 信息 的 来 源 进 行 判断 ， 能 对 伪造 来 源 的 信息 予以 鉴别 

未 柯 白地 性 。 | 也 称 作 不 可 否认 性 ， 通 过 建立 有 效 的 控制 机 制 ， 防 上 相关 方 否 认 其 行为 ， 这 一 属性 
在 金融 信息 安全 中 极其 重要 

Sr 对 信息 的 传播 及 内 容 具有 控制 能 力 。 授 权 机 构 对 信息 的 内 容 及 传播 具有 控制 能 力 ， 
可 以 控制 授权 范围 内 的 信息 流向 及 其 方法 

二 对 出 现 的 安全 问题 提供 调查 的 依据 和 手段 。 在 信息 交换 过 程 结束 后 ， 相 关 方 不 能 抵 
赖 曾经 做 出 的 行为 ， 也 不 能 否认 曾经 发 送 /接收 的 信息 

信息 系统 在 限定 条 件 和 限定 时 间 内 完成 规定 动作 ， 可 靠 性 是 信息 系统 建设 和 运行 的 
基本 要 求 ， 也 是 金融 信息 安全 的 重要 目标 
具备 应 对 风险 进行 自动 调整 和 快速 反应 的 能 力 ， 以 保证 关键 业务 的 连续 运转 。 金 融 

连续 性 业 信息 安全 的 连续 性 主要 包括 高 可 用 性 (high availability) 、 连 续 性 (continuous 


operation) 和 灾难 恢复 (disaster recovery) 
总 的 来 说 ， 金 融 信息 安 全 研究 的 领域 和 范畴 与 一 般 信息 安全 有 较 多 相似 性 ， 但 从 行业 
应 用 来 看 ， 更 加 注重 涉及 保密 性 、 完 整 性 、 可 用 性 、 真 实 性 、 可 追溯 性 、 可 靠 性 保护 和 连 
续 性 等 方面 的 技术 和 理论 。 


8.1.3 金融 信息 安全 的 重要 性 

1. 金融 安全 是 国家 安全 中 重要 而 根本 的 内 容 之 一 

从 某 种 意义 来 说 ， 国 家 间 的 竞争 和 博弈 ， 本 质 上 是 经 济 实力 的 竞争 ， 其 中 ， 没 有 金融 
安全 的 保障 ， 就 没有 国家 发 展 的 基础 ， 甚 至 危及 国家 最 基本 的 稳定 。 我 国 的 金融 系统 信息 
化 建设 起 步 较 晚 ， 大 量 借鉴 了 国外 的 金融 信息 化 发 展 模式 ， 部 署 了 大 量 国外 提供 的 网 络 设 
备 和 主机 设备 、 操 作 系统 、 中 间 件 系统 以 及 金融 核心 业务 系统 ， 同 时 ， 也 大 量 采 购 了 各 种 
保障 金融 业务 的 咨询 、 方 案 、 运 维 等 服务 内 容 。 金 融 行业 掌握 着 国家 的 命脉 ， 金 融 安全 关 


系 国 家 安全 。 
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然而 ， 随 着 经 济 相互 依赖 性 增强 、 信 息 通信 技术 快速 发 展 、 金 融 领 域 的 逐步 开放 ， 以 
及 新 型 金融 业务 的 推广 等 ， 国 家 金融 安全 面临 着 与 以 往 不 同 的 风险 ， 需 要 高 度 重 视 。 

网 络 空 间 安全 与 金融 安全 的 关系 网 络 空间 安全 与 金融 安全 密切 相关 ， 新 一 代 信 息 技术 
所 具有 的 融合 、 智 能 、 宽 带 、 移 动 、 泛 在 等 基本 特点 ， 以 及 “智慧 城市 ”的 推进 和 发 展 ， 
使 网 络 空间 和 所 有 的 传统 空间 领域 越 来 越 深入 地 融合 ， 网 络 空间 安全 直接 关系 到 所 有 传统 
领域 的 安全 。 从 国家 发 展 的 不 同 领域 来 说 ， 政 务 、 金 融 、 国 防 、 科 技 、 社 会 稳定 等 各 个 
方面 ， 都 离 不 开 网 络 空 间 安全 保障 。 因 此 ， 网 络 空间 安全 目前 成 为 最 受 各 国 重 视 的 热门 
话题 。 

在 这 种 环境 下 ， 金 融 安全 的 保障 ， 离 不 开 对 网 络 空间 安全 保障 的 深入 理解 和 结合 。 
微观 来 看 ， 电 子 商 务 、 网 上 支付 、 网 上 银行 甚至 传统 的 信用 卡 等 业务 ， 受 到 交易 过 程 安全 
的 影响 ， 也 受到 “网 络 钓鱼 ”等 在 线 身份 窃取 类 攻击 的 威胁 ， 已 经 有 大 量 案例 。 从 宏观 来 
看 ， 传 统 的 金融 风险 管理 手段 ， 不 能 完全 涵盖 恶意 利用 各 类 自动 交易 机 制 与 系统 (例如 证 券 
市 场 的 量化 投资 ) 存 在 的 缺陷 ， 在 短 时 间 内 将 给 国家 造成 巨大 的 金融 损失 ， 或 者 引起 民众 恐 
慌 进 而 引发 社会 动荡 风险 。 

近年 来 ， 网 络 空间 安全 形势 十 分 严峻 。 我 国 每 年 都 发 现 千 万 级 左右 的 瑟 地 址 被 境外 
攻击 者 秘密 控制 ， 大 量 重要 网 站 的 数据 被 大 规模 窃取 。 随 着 银联 等 金融 业务 走向 国际 ， 网 
络 钓鱼 攻击 等 身份 窃取 攻击 转向 我 国 银行 等 网 站 ， 移 动 互 联网 的 快速 发 展 和 深入 应 用 ， 使 
智能 终端 成 为 重点 攻击 目标 ， 恶 意 应 用 增长 迅猛 ， 直 接 威 胁 用 户 经 济 利益 及 金融 新 业务 推 
广 。 此 外 网 络 拒绝 服务 攻击 十 分 活跃 ， 针 对 我 国信 息 基础 设施 的 严重 攻击 事件 时 有 发 生 ， 
新 型 攻击 手段 不 断 出 现 ， 重 要 用 户 部 门 却 对 其 了 解 不 多 。 

目前 ， 网 络 空间 中 的 威胁 因素 高 度 复杂 。 网 络 空间 安全 大 致 经 历 了 4 个 阶段 。 第 一 阶 
段 是 “ 白 开 心 ”， 攻 击 者 主要 是 “脚本 小 子 (SCRIPT KIDS)” 或 纯粹 的 技术 黑客 ， 行 为 
“损人 不 利己 ”， 形 式 主要 是 计算 机 病毒 、 蠕 虫 和 拒绝 服务 攻击 等 ， 第 二 阶段 是 “ 淘 黑 
金 ”， 标 志 是 “ 趋 利 ”， 攻 击 者 为 各 类 计算 机 犯罪 分 子 ， 攻 击 目标 主要 是 商业 性 网 站 和 用 
户 ， 攻 击 形式 是 木马 、 网 络 钓鱼 、 拒 绝 服 务 攻击 等 ; 第 三 阶段 是 “ 窍 密 者 ”， 攻 击 者 是 
互联 网 窃 密 行为 ， 不 仅 窃 取 商 业 秘密 ， 还 包括 军事 秘密 、 经 济 情报 、 科 技 情报 等 ， 攻 击 形 
式 是 通过 木马 、 僵 尸 网 络 等 ， 并 结合 社会 工程 学 手段 ; 2010 年 始 进入 第 四 阶段 ， 即 “大 
玩家 ”阶段 ， 具 有 政治 动机 并 具备 资源 和 能 力 优势 的 攻击 者 出 现 ， 国 家 势力 成 为 攻击 发 起 
方 之 一 。 网 络 中 混杂 不 同 攻 击 者 带 来 的 安全 威胁 。 相 较 而 言 ， 趋 利 性 攻击 在 数量 上 占 主 
流 ， 但 国家 势力 发 起 的 攻击 ， 隐 蔽 性 和 破坏 性 十 分 突出 。 不 同 的 攻击 者 和 动机 会 导致 攻击 
目标 、 方 法 、 拥 有 的 资源 、 破 坏 能 力 等 都 有 很 大 差异 。 因 此 ， 思 想 及 安全 保障 能 力 要 做 大 
调整 。 

网 络 空间 安全 目前 进入 国家 间 对 抗 阶段 。 除 技术 层面 出 现 只 有 国家 力量 才 可 能 完成 的 
高 度 复杂 的 攻击 事件 外 ， 在 战略 、 外 交 、 产 业 等 层面 明显 表现 出 “冷战 ”时 期 的 特点 。 国 
际 层面 对 抗 抬头 ， 信 任 降低 ， 合 作 受 影响 。 对 “大 玩家 ”拥有 的 手段 、 具 备 的 能 力 、 掌 握 
的 资源 (包括 战略 级 的 漏洞 或 后 门 )、 洪 在 动机 等 ， 已 有 网 络 安全 保障 力量 了 解 甚 少 。 基 于 经 
验 、 能 力 和 机 制 ， 来 应 对 当前 国家 间 网 络 安全 对 抗 中 可 能 产生 的 威胁 ， 是 目前 的 最 大 风险 。 

对 金融 领域 亦 如 此 。 针 对 金融 领域 的 攻击 ， 除 网 络 钓鱼 、 金 融 诈骗 、 非 法 转账 及 其 他 
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以 获 利 为 目的 的 漏洞 利用 行为 之 外 ， 国 家 势力 或 恺 怖 分 子 还 可 能 发 起 其 他 类 型 、 充 分 利用 
其 特殊 资源 、 以 破坏 金融 体系 或 造成 重大 损失 为 终 目 的 的 攻击 。 


2. 金融 信息 安全 是 国家 发 展 战略 的 重要 基石 


金融 是 现代 经 济 的 核心 ， 金 融 信 息 系 统 是 国家 重要 的 关键 信息 基础 设施 。 金 融 信息 安 
全 不 仅 关系 国家 经 济 社会 安全 ， 也 关系 着 金融 企业 的 持续 发 展 。 金 融 信息 安全 无 疑 是 国家 
发 展 战略 的 重要 基石 。 

人 类 进入 21 世纪 以 后 ， 信 息 安全 问题 变 得 日 益 重 要 ， 目 前 已 经 上 升 到 国家 发 展 战略 
层面 ， 很 多 发 达 国 家 视 其 为 仅 次 于 恐怖 袭击 的 重大 安全 领域 。 

互联 网 的 普及 和 信息 技术 的 发 展 给 金融 行业 带 来 了 前 所 未 有 的 机 遇 ， 金 融 系 统 得 到 了 
莲 过 发 展 。 计 算 机 正 越 来 越 多 地 参与 到 金融 系统 活动 当中 ， 成 为 其 不 可 或 缺 的 一 部 分 。 而 
电子 信息 化 也 成 为 现代 金融 发 展 必 然 的 趋势 。 但 与 此 同时 ， 信 息 技术 的 参与 也 在 一 定 程度 
上 削弱 了 交易 的 可 控 性 ， 使 交易 风险 大 大 增加 。 任 何 一 个 精通 计算 机 或 网 络 的 人 都 有 机 会 
对 金融 系统 进行 蓄意 破坏 ， 人 为 的 干预 和 破坏 都 会 对 金融 系统 带 来 重大 的 影响 。 在 金融 系 
统 中 ， 运 行 的 数据 基本 上 都 是 以 资金 信息 为 主 ， 由 于 其 庞大 的 用 户 基数 并 随 着 时 间 的 积累 
逐渐 形成 了 海量 的 数据 ， 这 些 数 据 的 存储 和 保护 给 人 们 带 来 了 巨大 的 挑战 。 金 融 信 息 往往 
涉及 国家 、 集 体 或 个 人 的 利益 ， 一 旦 有 数据 损坏 或 者 非法 数据 访问 ， 都 将 造成 不 可 弥补 的 
经 济 损失 。 因 此 ， 金 融 信息 安全 正成 为 一 个 具有 挑战 性 的 命题 。 
随 着 我 国信 息 化 的 不 断 推进 ， 国 家 对 信息 安全 工作 的 重视 程度 日 益 增 加 。2012 年 7 
月 ， 国 务 院 发 布 了 《关于 大 力 推进 信息 化 发 展 和 切实 保障 信息 安全 的 若干 意见 》， 这 是 国 
家 信息 化 建设 和 信息 安全 工作 的 纲领 性 文件 ， 对 于 今后 我 国信 息 化 建设 和 信息 安全 工作 具 
有 重大 的 指导 意义 。 


(OD 下 了 大 数据 给 我 国 金融 信息 安全 带 来 的 机 遇 和 挑战 


任何 事物 的 发 展 都 具有 两 面 性 。 大 数据 的 快速 发 展 在 为 金融 信息 安全 带 来 发 展 机 遇 的 
同时 ， 也 带 来 了 一 些 挑战 。 


8.2.1 大 数据 给 金融 信息 安全 带 来 的 机 遇 


大 数据 实现 了 对 传统 数据 信息 结构 的 解构 ， 与 传统 数据 结构 相 比 成 为 一 个 具有 流动 
性 、 信 息 共享 与 连接 的 数据 池 。 

通过 这 种 灵活 的 大 数据 技术 ， 人 们 可 以 在 最 大 程度 上 利用 人 们 以 为 无 法 有 效 利 用 的 数 
据 信息 形式 来 实现 对 金融 企业 的 高 效 运营 ， 为 金融 业 的 发 展 也 带 来 了 更 大 的 机 遇 。 大 数据 
信息 技术 的 提高 也 使 得 数据 信息 安全 工具 和 技术 有 所 发 展 ， 让 金融 信息 安全 的 监督 更 加 精 
细 、 高 效 与 及 时 。 

1. 对 大 数据 的 挖掘 和 应 用 将 创造 更 多 的 价值 

在 大 数据 时 代 ， 大 数据 的 发 展 重点 已 经 从 数据 的 存储 与 传输 发 展 到 了 数据 的 挖掘 和 应 
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用 ， 这 将 引起 金融 企业 发 展 的 商业 模式 的 变化 ， 并 且 能 为 金融 企业 带 来 直接 的 利润 ， 也 可 
以 通过 积极 的 反馈 来 增强 金融 企业 的 竞争 力 。 


2. 大 数据 的 安全 念 发 重要 ， 为 金融 信息 安全 带 来 了 发 展 机 遇 


在 大 数据 时 代 下 ， 金 融 信息 安全 事件 发 生 的 次 数 逐 年 增多 ， 人 金融 信息 安全 事件 所 引发 
的 数据 泄露 并 由 此 带 来 的 经 济 损失 也 越 来 越 大 。 

随 着 科学 技术 网 络 的 不 断 进步 ， 大 数据 安全 不 仅 是 金融 企业 需要 面临 和 维护 的 对 象 ， 
也 是 个 人 消费 者 要 面 对 的 对 象 。 大 数据 已 然 渗透 到 我 们 生活 的 方方面面 ， 这 一 切 使 得 金融 
信息 安全 越 来 越 重 要 。 

大 数据 提高 了 金融 数据 信息 的 价值 ， 但 是 数据 信息 安全 意识 薄弱 以 及 频 发 的 金融 信息 
安全 事件 ， 对 信息 安全 技术 和 工具 均 提 出 了 更 高 的 要 求 。 目 前 所 使 用 的 信息 安全 技术 、 工 
具 、 管 理 手段 以 及 相关 的 不 能 解决 这 个 问题 的 方法 、 方 式 都 应 该 得 到 改进 ， 而 大 数据 的 发 
展 为 这 一 发 展 提供 了 巨大 的 可 能 性 。 所 有 这 些 ， 都 为 金融 信息 安全 的 发 展 提供 了 新 的 发 展 
机 遇 。 

3. 在 大 数据 时 代 下 ， 加 快 了 信息 安全 的 发 展 速度 ， 云 技术 拥有 巨大 潜力 


在 大 数据 这 条 巨大 的 产业 链 中 ， 参 与 者 众多 ， 面 积 也 十 分 广泛 。 如 果 按照 产品 的 基本 
形态 来 进行 划分 ， 可 分 为 硬件 、 应 用 软件 和 基础 软件 三 大 类 。 云 技术 和 金融 信息 安全 纵 贯 
这 三 大 领域 。 纵 观 各 个 领域 的 国内 外 的 发 展 情况 ， 信 息 安全 和 商业 智能 的 发 展 速度 最 快 ， 
尤其 是 云 技术 ， 它 将 有 更 大 的 发 展 潜能 。 这 三 者 将 成 为 大 数据 产业 链 的 三 大 主要 推动 力 。 


8.2.2 ”大 数据 给 我 国 金融 信息 安全 带 来 的 挑战 


由 于 大 数据 参与 金融 业 发 展 起 步 较 晚 ， 目 前 还 不 成 熟 。 大 数据 金融 并 不 都 意味 着 机 遇 
或 者 商业 上 的 无 限 潜力 ， 在 我 们 能 够 很 好 地 了 解 大 数据 、 管 理 大 数据 之 前 ， 实 际 上 还 同时 
意味 着 巨大 的 风险 。 


1. 数据 应 用 侵犯 客户 个 人 隐私 


大 数据 技术 的 应 用 和 隐私 保护 的 价值 的 争议 由 来 已 入。 目前 ， 随 着 技术 的 高 速 发 展 ， 
信息 传递 技术 与 超 强 的 计算 机 系统 使 得 数据 高 速 分 析 成 为 可 能 。 交 叉 检验 技术 和 “ 块 数 
据 ” 技 术 的 广泛 应 用 ， 使 得 基于 大 数据 的 身份 识别 日 益 简单 且 难 以 察觉 。 近 年 来 ， 大 数据 
金融 需要 对 客户 信息 进行 全 方位 的 分 析 与 应 用 。 但 是 ， 这 些 应 用 也 容易 跨越 雷池 ， 控 掘 过 
多 的 私人 信息 ， 造 成 对 客户 隐私 的 侵犯 。 

2. 数据 监听 威胁 国家 金融 安全 

2013 年 “棱镜 门 ”事件 表明 ，“ 海 量 数据 + 数据 挖掘 ”的 大 数据 监听 模式 可 以 对 他 国 
重要 机 构 进行 精确 监听 。 无 论 是 软 硬 件 设施 还 是 数据 服务 ， 我 国 金融 企业 都 过 度 依赖 国外 
厂商 。 在 信息 传输 的 各 个 环节 ， 中 国 金融 企业 和 金融 机 构 的 内 部 信息 可 能 通过 国外 厂商 预 
留 的 “后 门 ”泄露 给 国外 机 构 ， 从 而 成 为 大 数据 监听 的 受害 者 。 
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3. 虚假 数据 导致 金融 市 场 异常 敏感 


由 于 信用 信息 是 互联 网 金融 的 纽带 ， 是 驱动 业务 的 核心 因素 ， 因 此 ， 基 于 信用 信息 数 
据 的 金融 决策 对 信息 非常 敏感 ， 从 而 导致 金融 市 场 敏感 。 如 果 数 据 不 准确 ， 就 可 能 导致 错 
误 的 交易 行为 ， 并 进一步 引发 金融 市 场 风险 。2013 年 4 月 23 日 ， 美 联 社 Twitter 账号 出 现 
“白宫 遭 克 ” 的 假 新 闻 。 受 此 影响 ， 众 多 基金 公司 的 交易 程序 自动 抛售 股票 ， 美 国 股市 随 
即 暴跌 。 


4. 法 律 监管 缺失 存在 风险 


由 于 中 国 大 数据 金融 发 展 时 间 较 短 ， 金 融 市 场 内 现 有 的 证 券 法 、 银 行 法 、 保 险 法 等 都 
是 在 传统 金融 模式 的 运营 下 制定 的 ， 面 对 大 数据 金融 相关 的 金融 创新 产品 ， 约 束 力 不 强 ， 
不 能 有 效 地 适用 于 这 一 新 生 事物 的 需要 ， 对 大 数据 征 信 数 据 处 理 的 各 环节 及 个 人 隐私 等 问 
题 未 定义 明确 界限 。 

目前 ， 我 国 金融 信息 安全 的 法 律 风 险 主要 包括 两 个 方面 : 一 是 金融 信息 安全 法 律 法 规 
不 够 健全 ;二 是 金融 信息 安全 立法 相对 滞后 和 模糊 。 近 年 来 ， 我 国 相继 出 台 了 《电子 签名 
法 》《 网 上 银行 业务 管理 暂行 办 法 》《 网 上 证 券 委托 管理 暂行 办 法 》《 证 券 账户 非 现场 开 
户 实施 暂行 办 法 》 等 法 律 法 规 ， 但 这 些 法 律 法 规 也 只 是 基于 传统 金融 业务 的 网 上 服务 制定 
的 ， 并 不 能 满足 互联 网 金融 发 展 的 需求 。 因 此 ， 在 利用 互联 网 提供 或 接受 金融 服务 时 ， 配 
套 法 规 的 缺乏 容易 导致 交易 主体 间 的 权利 、 义 务 不 明确 ， 增 加 相关 交易 行为 及 其 结果 的 不 
确定 性 ， 导 致 交易 风险 增加 ， 不 利于 互联 网 金融 的 健康 发 展 。 


5. 层出不穷 的 互联 技术 应 用 是 当前 金融 信息 安全 面临 的 最 大 挑战 


移动 互联 、 云 计算 、 下 一 代 互 联网 、 大 数据 等 新 兴 技术 的 蓬勃 发 展 ， 是 催生 互联 网 金 
融 时 代 快 速 到 来 的 主要 推手 。 一 方面 ， 这 些 基 于 开放 性 网 络 的 互联 网 金融 服务 ， 使 得 以 往 
金融 信息 安全 技术 防范 已 经 不 能 全 部 适应 新 互联 网 技术 的 进步 速度 ， 另 一 方面 ， 这 些 新 兴 
互联 网 技术 自身 还 在 不 断 发 展 ， 其 技术 成 熟 度 还 不 稳定 ， 特 别 是 第 三 方 支付 、P2P 等 互联 
网 金融 新 业态 还 处 于 起 步 阶段 ， 其 信息 安全 管理 水 平 不 高 。 如 何 尽 快 建立 一 套 既 符合 金融 
行业 特点 ， 又 能 快速 跟 进 互联 网 新 技术 发 展 需 要 的 金融 信息 安全 技术 规范 显得 十 分 紧迫 。 


6. 网 络 安全 防 控 是 互联 网 金融 信息 安全 防范 的 难点 


《2013 年 中 国 互联 网 发 展 报告 》 中 指出 2013 年 互联 网 遭 到 的 网 络 攻击 同比 增长 
14%， 已 经 连续 多 年 呈 上 升 趋势 ， 其 中 涉及 客户 信用 卡 信 息 、 各 种 资金 账户 信息 的 非法 网 
络 攻击 行为 增 速 位 居 前 列 。 曾 有 专家 说 过 ，“ 互 联网 金融 第 一 要 素 就 是 互联 网 ， 安 全 就 是 
生命 线 ”。 由 于 互联 网 模糊 了 传统 金融 领域 的 界限 ， 使 得 金融 行为 范畴 借助 互联 网 技术 衍 
生 到 前 所 未 有 的 新 领域 。 一 方面 ， 无 论 是 传统 金融 机 构 还 是 新 生 的 互联 网 金融 公司 ， 来 自 
互联 网 的 各 种 入 侵 破 坏 行为 已 经 成 为 日 常 信息 安全 防范 的 重点 ; 另 一 方面 ， 在 互联 网 开放 
性 的 影响 下 ， 各 类 基于 互联 网 平台 的 金融 创新 业务 也 带 来 一 些 类 似 网 络 洗钱 和 网 上 支付 诈 
骗 的 社会 安全 问题 ， 这 类 网 络 安全 防 控 不 断 突破 传统 金融 安全 的 范畴 ， 让 金融 信息 安全 防 
范 的 工作 变 得 更 加 复杂 。 
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8.2.3 案例 : 美国 “棱镜 门 ”事件 


1. “棱镜 门 ”事件 回顾 


2013 年 6 月 ， 美 国 前 中 情 局 职员 爱德华 -斯 诺顿 将 两 份 绝密 资料 交 给 英国 《 卫 报 》 和 
美国 《华盛顿 邮 报 》 发 表 ， 美 国 国家 安全 局 有 一 项 代号 为 “棱镜 ”的 秘密 项 目 要 求 电信 巨 
头 威 瑞 森 公司 必须 每 天 上 交 数 百 万 用 户 的 通话 记录 ， 通 过 进入 谷歌 、 雅 虎 、 微 软 、 苹 果 、 
Facebook、 美 国 在 线 、PalTalk、Skype、YouTube 等 九 大 网 络 巨 头 的 服务 器 ， 监 控 美 国 公 
民 的 电子 邮件 、 聊 天 记录 、 视 频 、 照 片 等 秘密 资料 ， 同 时 ， 斯 诺 登 称 美 情报 部 门 2009 年 
起 开始 监控 中 国内 地 和 香港 电脑 系统 ， 全 世界 与 论 哗然 ， 中 国 网 络 安全 堪忧 。 

棱镜 计划 (PRISM) 是 一 项 由 美国 国家 安全 局 (NSA) 自 2007 年 起 开始 实施 的 绝密 电子 监 
听 计 划 。 该 计划 的 正式 名 号 为 “US-984XN”。 了 PRISM 计划 能 够 对 即时 通信 和 既 存 资料 进 
行 深度 的 监听 。 许 可 的 监听 对 象 包括 任何 在 美国 以 外 地 区 使 用 参与 计划 公司 服务 的 客户 ， 
或 是 任何 与 国外 人 士 通信 的 美国 公民 。 

受到 美国 国安 局 信息 监视 项 目 一 一 “棱镜 ”监控 的 主要 有 10 类 信息 : 电邮、 即时 消 
息 、 视 频 、 照 片 、 存 储 数据 、 语 音 聊天 、 文 件 传输 、 视 频 会 议 、 登 录 时 间 和 社交 网 络 资 
料 ， 具 体 细节 都 被 政府 监控 。 

通过 棱镜 项 目 ， 国 安 局 甚至 可 以 实时 监控 一 个 人 正在 进行 的 网 络 搜索 内 容 。“ 棱 镜 计 
划 ” 项 目 监视 范围 很 广 ， 主 要 从 美国 的 网 络 服务 商 直 接 获取 相关 数据 ， 这 些 服务 商 涵 盖 了 
互联 网 行业 的 多 家 巨头 ， 包 括 微软 、 雅 虎 、 谷 歌 、Facebook 、Pal Talk 、YouTube、 
Skype、AOL 和 Apple( 见 下 图 )。 


服务 商 加 入 时 间 监听 数据 类 型 
微软 2007-09 电子 邮件 
雅虎 2008-03 聊天 记录 
谷歌 2009-01 视频 、 图 像 
Facebook 2009-06 网 络 存储 数据 
Pal Talk 2009-12 本 IP 电 话 
YouTube 2010-09 文件 传输 
Skype 2011-02 视频 会 议 
AOL 2011-03 被 监视 目标 的 网 络 行为 
Apple 2012-10 网 络 社交 的 具体 细节 


《华盛顿 邮 报 》 披 露 的 “棱镜 计划 ”涉及 企业 
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2. 棱镜 门 事件 所 折射 出 的 美国 的 全 球 网 络 空间 霸权 战略 


今世 界 ， 美 国 作为 互联 网 的 发 源 地 和 管理 大 本 营 ， 时 时 刻 刻 监视 着 全 球 各 国 的 一 举 
一 动 ， 信 息 安全 就 是 国家 安全 。 美 国 严密 控制 全 球 互联 网 ， 支 撑 其 超级 大 国 的 网 络 空间 霸 
权 。 自 互联 网 在 美国 军 方 的 诞生 到 成 熟 进 化 到 全 球 互 联网 ， 美 国 商务 部 领导 的 多 个 非 营利 
机 构 行使 全 球 互联 网 管理 职责 ， 对 互联 网 的 技术 标准 、 管 理 规范 、 域 名 系统 、 网 络 地 址 等 
进行 管理 。 

2012 年 12 月 ， 在 国际 电 联 178 个 国家 参与 的 关于 修改 《国际 电信 条 约 》 会 议 上 ， 由 
中 国 、 俄 罗斯 、 印 度 等 要 求 由 联合 国旗 下 的 国际 电信 联盟 来 共同 管理 全 球 互联 网 络 ， 被 美 
国 断 然 拒绝 ， 超 级 大 国 的 网 络 空间 霸权 难以 撼动 。 

1) 美国 以 占据 市 场 主流 地 位 的 高 技术 公司 为 先锋 ， 立 法 贯彻 网 络 空间 国家 战略 

2001 年 10 月 26 日 ， 美 国 颁布 了 《美国 爱国 者 法 案 》。 根 据 法 案 要求 ， 警 察 机 关 有 权 
搜索 电话 、 电 子 邮 件 通讯 、 医 疗 、 财 务 和 其 他 种 类 的 记录 ， 特 别 是 去 掉 了 对 美国 本 土 情报 
单位 的 法 律 约束 限制 。 

按照 法 案 要 求 ， 美 国 “ 八 大 金刚 ”( 思 科 、IBM、Google、 高 通 、 英 特 尔 、 苹 果 、 
Oracle、 微 软 ) 都 或 主动 或 被 动 地 向 美 当局 交付 信息 。 谷 歌 公开 承认 已 根据 《美国 爱国 者 法 
案 》 规 定 ， 把 欧洲 资料 中 心 的 信息 交 给 了 美国 情报 机 构 。 微 软 也 公开 承认 美国 依法 获取 欧 
盟 云端 资料 ， 毫 无 悬念 ， 任 何 一 家 美国 公司 ， 不 论 是 谷歌 、 微 软 还 是 思科 ， 都 作为 美国 的 
急 先 锋 ， 在 市 场 经 济 的 合法 外 衣 下 ， 忠 实 执行 着 美国 网 络 空间 霸权 的 国家 战略 。 

2) “美国 实施 全 面 持续 的 网 络 监 控 计 划 

“棱镜 ”(PRISM) 项 目 只 是 美国 政府 秘密 监控 系统 的 “冰山 一 角 ”， 仅 美国 国家 安全 
局 (NSA) 就 实施 了 4 项 监控 项 目 ， 并 专 设 了 一 个 1000 人 的 情报 收集 部 门 “定制 入 口 行动 办 
公 室 ”(TAO)。 

4 项 监控 项 目 分 别 为 “主干 道 ”(MAINWAY)、“ 码 头 ”(MARINA)、“ 核 子 ” 
(NUCLEON) 和 “棱镜 ”(PRISM) 项 目 。“ 主 干道 ”和 “核子 ”项 目 负责 电信 网 的 基础 数据 
和 通话 内 容 的 监控 ， “码头” 和 “棱镜 ”项 目 负 责 互联 网 基础 数据 和 通信 内 容 的 监控 ，4 
大 秘密 监视 项 目 帮助 美国 政府 对 全 球 通信 进行 了 有 效 监控 。 

(1) “主干 道 ” 项 目 。 为 美国 国家 安全 局 ， 监 视 电 信 网 上 数 以 亿 兆 计 的 “元 数据 ”， 
即 通话 的 时 间 、 地 点 、 设 备 、 参 与 者 等 ， 进 行 存储 和 分 析 。 美 国 国安 局 2009 年 花费 1.46 
亿美 元 购买 硬盘 等 设备 ， 用 来 存储 “主干 道 ” 监 视 项 目的 元 数据 。 

(2) “码头 ”项 目 。 为 美国 国家 安全 局 ， 监 视 互联 网 上 数 以 亿 兆 计 的 “元 数据 ”， 即 
通信 的 时 间 、 地 点 、 设 备 、 参 与 者 等 ， 进 行 存储 和 分 析 。 

(3) “核子 ”项 目 。 为 美国 国家 安全 局 ， 专 门 截获 电信 网 上 的 电话 通话 内 容 。 从 2002 
年 开始 ， 美 国 4 大 电信 运营 商 Verizon、AT&T、T-Mobile 和 Sprint 就 开始 “自愿 ”与 美国 
国家 安全 局 合作 。 

(4) “棱镜 ”项 目 。 为 美国 国家 安全 局 和 联邦 调查 局 ， 负 责 截取 互联 网 通信 内 容 。 
“棱镜 ” 接 入 谷歌 、 雅 虎 、 微 软 等 9 家 大 型 跨国 IT 企业 的 服务 器 ， 截 取 互联 网 内 容 ， 
“定制 入 口 行动 办 公 室 ”(TAO)， 是 美国 国家 安全 局 下 设 部 门 ， 一 直 从 事 侵入 中 国境 内 电 
脑 和 通信 系统 的 网 络 攻击 ， 借 此 获取 有 关中 国 的 有 价值 情报 。“ 定 制 入 口 行动 办 公 室 ” 


I 
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1997 年 成 立 ， 专 门 从 事 秘 密 侵入 外 国 目 标 电脑 和 通信 系统 ， 破 解密 码 和 安全 防火 墙 ， 获 取 
和 复制 目标 信息 。“ 定 制 入 口 行动 办 公 室 ” 旗 下 的 军事 和 民间 “黑客 ”、 情 报 分 析 师 、 目 
标定 位 专家 、 计 算 机 硬件 和 软件 设计 师 以 及 电子 工程 师 总 数 超过 1000 名 ， 是 国家 安全 局 
最 大 、 也 是 最 重要 的 部 门 。 

3) “美国 IT 企业 在 监控 计划 中 的 关键 作用 

美国 IT 企业 在 针对 网 络 的 监控 计划 中 起 到 关键 人 作用。 微软、 雅虎 、 谷 歌 、Facebook、 
PalTalk、 美 国 在 线 、Skype、YouTube、 苹 果 9 家 大 型 跨国 IT 企业 在 PRISM 计划 中 占有 至 
关 重 要 的 地 位 。9 家 IT 企业 的 积极 主动 配合 ， 使 得 美国 国家 安全 局 可 以 接触 到 大 量 个 人 聊 
天 日 志 、 存 储 的 数据 、 语 音 通信 、 文 件 传输 、 个 人 社交 网 络 数据 。 同 时 ， 思 科 等 基础 设施 
厂商 也 参与 到 棱镜 计划 ， 美 国 国家 安全 局 通过 思科 路 由 器 监控 世界 各 国 网 络 和 电脑 ， 思 科 
的 通信 设备 已 分 布 在 全 球 各 大 洲 各 个 角落 。 

美国 9 家 IT 企业 先后 加 入 棱镜 计划 ，2007 年 9 月 微软 公司 率先 加 入 棱镜 计划 ，2008 
年 3 月 雅虎 加 入 ，2009 年 1 月 谷歌 加 入 ， 同 年 6 月 雅虎 加 入 ， 同 年 12 月 PalTalk 加 入 ， 
2010 年 9 月 YouTube 加 入 ，2011 年 2 月 Skype 加 入 ， 同 年 3 月 AOL 加 入 ， 苹 果 公 司 
2012 年 10 月 加 入 棱镜 计划 。 

英特尔 旗下 信息 安全 公司 McAfee 就 常 与 NSA、FBI 和 CIA 合作 。McAfee 被 视 为 有 
价值 的 合作 伙伴 ， 因 为 该 公司 能 通 观 恶意 互联 网 流量 的 情况 ， 包 括 外 国势 力 的 间谍 活动 。 
一 些 黑客 利用 合法 服务 器 从 事 黑客 活动 ， 而 McAfee 防火 墙 能 收集 到 这 些 黑客 的 信息 。 此 
外 ，McAfee 的 数据 还 能 表明 一 些 网 络 攻击 源 自 哪里 。McAfee 同时 也 了 解 全 球 的 信息 网 络 
架构 ， 这 对 情报 部 门 来 说 很 有 意义 。 

美国 电信 运营 商 在 针对 电信 网 的 监控 计划 中 起 到 关键 作用 。Verizon、AT&T、T- 
Mobile 和 Sprint 等 4 家 大 型 运营 商 为 美国 国家 安全 局 提供 了 接 入 国内 和 国际 通信 网 的 “后 
门 ”通道 ， 方便 NSA 通过 对 电信 网 络 进行 监听 的 方式 ， 收 集 了 大 量 电信 数据 和 很 多 的 交 
谈 信 息 ， 在 美国 监控 计划 中 扮演 了 重要 角色 。 美 国 国内 最 大 的 电信 运营 商 Verizon 公司 就 
是 “主干 道 ”监控 项 目的 一 个 原始 情报 信息 提供 者 ，NSA 通过 Verizon 收集 数 百 万 美国 客 
户 的 电话 记录 ， 包 括 美国 国内 的 电话 和 由 国内 打 往 外 国 的 电话 。 


3. “棱镜 门 ”事件 折射 出 的 美国 信息 战略 


1) ”美国 信息 监控 计划 是 一 个 包含 政府 、 企 业 和 与 论 的 三 位 一 体 长 期 战略 

在 美国 信息 监控 计划 中 ， 政 府 、IT 企业 和 社会 团体 分 别 扮演 了 不 同 角色 ， 相 互 配合 ， 
默契 互动 ， 共 同 推动 网 络 监控 计划 实施 ， 保 证 美国 国家 安全 。 一 是 美国 政府 部 门 ， 如 美国 
国家 安全 局 、 国 防 部 和 联邦 调查 局 等 积极 开展 监控 计划 的 组 织 、 计 划 和 评估 工作 ; 二 是 美 
国 IT 企业 是 美国 监控 计划 的 具体 实施 机 构 和 重要 支撑 部 门 ， 是 海量 信息 和 数据 的 来 源 ， 
是 监控 计划 的 实施 主体 ;三 是 政府 官员 、 议 员 、 权 威 专家 和 非 营利 组 织 以 保护 国家 安全 为 
由 ， 对 美国 监控 计划 进行 声援 、 游 说 和 宣传 。 

2) 美国 IT 企业 已 经 成 为 美国 网 络 战 的 主力 军 

网 络 战 呈现 出 军民 融合 的 趋势 ， 看 似 平静 的 和 平时 代 ， 美 国 已 经 通过 实施 各 种 计划 ， 
发 动 了 网 络 战争 ，IT 企业 已 成 为 网 络 战 主力 军 。 美 国 通信 巨头 思科 参与 了 中 国 几乎 所 有 大 
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型 网 络 项 目的 建设 ， 涉 及 政府 、 海 关 、 邮 政 、 金 融 、 铁 路 、 民 航 、 医 疗 、 军 警 等 要 害 部 门 
的 网 络 建设 ， 以 及 中 国电 信 、 中 国联 通 等 电信 运营 商 的 网 络 基础 建设 ， 然 而 思科 却 是 美国 
政府 和 军 方 的 通信 设备 和 网 络 技术 设备 主力 供应 商 。 微 软 在 中 国 乃至 全 球 都 是 占有 绝对 垄 
断 地 位 的 厂商 ， 其 Windows 系列 操作 系统 在 我 国 市 场 占有 率 超过 九 成 ， 其 Windows Phone 
手机 的 操作 系统 也 在 我 国 呈 现 快速 发 展 趋势 。 微 软 在 公开 发 布 补丁 修复 漏洞 之 前 ， 就 会 向 
情报 部 门 提供 这 些 漏洞 信息 ， 这 些 信 息 可 用 于 保护 政府 计算 机 ， 并 入 侵 恐 怖 分 子 或 敌对 方 
的 计算 机 。 

3) “美国 IT 企业 通过 深度 参与 我 国信 息 化 建设 全 面 威胁 网 络 空间 安全 

我 国 的 网 络 空间 安全 在 以 思科 为 代表 的 美国 大 型 IT 企业 面前 形同虚设 ， 在 我 国 绝 大 
多 数 核心 领域 ， 美 国 大 型 IT 企业 都 占据 了 庞大 的 市 场 份额 。 思 科 的 业务 已 经 渗透 到 国内 
几 大 领域 的 核心 企业 。 中 国 上 骨干 网 络 几乎 被 思科 产品 全 面 占据 ， 中 国电 信 163 和 中 国联 通 
169 承担 了 中 国 互联 网 80% 以 上 的 流量 ， 思 科 占 据 了 中 国电 信 163 骨干 网 络 约 73% 的 份 
额 ， 把 持 了 163 骨干 网 所 有 的 超级 核心 节点 和 绝 大 部 分 普通 核心 节点 ， 思 科 占 据 了 中 国联 
通 169 骨干 网 约 81% 的 份额 。 


4. 美国 IT 公司 对 我 国 各 行业 的 垄断 控制 


美国 IT 企业 已 经 在 我 国 骨干 网 络 的 基础 设备 、 服 务 器 、 个 人 电脑 、 手 机 终端 、 个 人 
软件 系统 等 行业 领域 中 占据 绝 大 多 数 的 市 场 份 额 ， 其 中 的 大 多 数 处 于 垄断 地 位 ， 控 制 着 我 
国 大 部 分 网 络 和 信息 系统 。 

1) ”思科 在 我 国 市 场 份额 巨大 

思科 不 仅 在 中 国 的 市 场 占有 率 奇 高 ， 而 且 几 乎 涵盖 了 我 国 大 部 分 至 关 重 要 的 领域 。 经 
过 19 年 在 中 国 的 发 展 ， 思 科 的 客户 已 经 遍布 了 国内 几 大 领域 的 核心 企业 ， 其 中 包括 中 国 
国家 金融 数据 通信 骨干 网 、 中 国电 信 、 中 国联 通 、 中 石化 、 中 国人 民 银 行 、 北 京 市 政府 等 
众多 央企 及 政府 部 门 。 

Intemet 骨干 网 络 是 公众 因特网 的 核心 ， 所 有 的 数据 都 要 经 过 骨干 网 进行 转发 ， 骨 干 网 
络 的 安全 性 是 电信 行业 的 重 中 之 重 。 而 思科 产品 占据 了 中 国电 信 163 和 中 联通 169 超过 
70% 的 份额 ， 把 持 了 几乎 所 有 的 超级 核心 节点 和 绝 大 部 分 普通 核心 节点 。 除 电信 行业 外 ， 
思科 在 金融 行业 、 政 府 机 构 、 铁 路 系统 、 民 航 的 空中 管制 骨干 网 络 、 电 视 台 及 传媒 行业 都 
占据 了 足以 形成 垄断 的 份额 。 

目前 思科 在 中 国 拥有 员工 超过 4000 人 ， 分 别 从 事 销 售 、 客 户 支 持 和 服务 、 研 发 、 业 
务 流程 运营 和 IT 服务 外 包 、 思 科 融 资 及 制造 等 工作 。 思 科 在 中 国 设立 了 12 个 业务 分 支 机 
构 ， 并 在 上 海 建立 了 一 个 大 型 研发 中 心 。 思 科 的 扩张 仍 在 继续 ， 专 家 指出 : “思科 把 持 着 
中 国 经 济 的 神经 中 枢 。 有 冲突 出 现时 ， 中 国 没有 丝毫 的 抵抗 能 力 。” 

2) ”IBM 为 我 国 服务 器 市 场 龙头 

IBM 在 中 国 服务 器 市 场 的 占有 率 为 19.3%， 处 于 第 一 的 位 置 ， 其 次 为 戴尔 、 惠 普 ， 
家 联合 起 来 占有 近 八 成 以 上 的 市 场 占有 率 。 而 联想 等 仅 有 不 到 10% 的 市 场 占有 率 。IBM 在 
中 国 地 区 的 业务 目前 已 深入 到 服务 器 、PC、 软 件 、 笔 记 本 等 多 个 IT 领域 内 ， 并 具有 相当 
的 影响 和 规模 。 
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据 国 家 工商 总 局 公平 交易 局 调查 资料 显示 ， 在 采用 英特尔 处 理 器 的 服务 器 领域 ，IBM 
市 场 占有 率 19.3%。 

3) ”英特尔 PC 微 处 理 器 市 场 占有 率 高 

英特尔 从 来 没有 公布 过 在 中 国 的 确切 销售 数字 。2012 年 统计 数据 中 显示 : 高 居 IT 产 
业 链 最 上 游 的 英特尔 在 全 球 PC 微 处 理 器 市 场 上 的 占有 率 已 经 扩大 到 接近 80%。 而 占 总 数 
近 1/3 的 最 终 产 品 输出 到 中 国 。 尽 管 在 移动 时 代 英 特 尔 在 全 球 芯 片 出 货 量 比 例 有 所 萎缩 ， 
但 是 在 中 国 PC 市 场 ， 英 特 尔 依 旧 占 有 绝对 领先 的 地 位 。 

4) “谷歌 安 卓 系统 在 我 国 市 场 占有 率 超 过 八成 

对 于 目前 火热 的 智能 手机 来 说 ， 在 中 国 市 场 ， 安 卓 远 远 地 甩 开 了 苹果 iOS 操作 系统 以 
及 微软 Windows Phone 以 及 Blackberry 10 等 ， 目 前 在 中 国 市 场 占 有 率 超 过 了 8 成 。 而 对 于 
目前 的 智能 手机 来 说 ， 其 安全 性 以 及 隐私 性 的 高 要 求 甚至 超过 了 传统 的 PC。 

5) ”微软 垄断 我 国 操作 系统 市 场 

微软 在 中 国 乃 至 全 球 都 是 占有 绝对 垄断 地 位 的 厂商 ， 其 Windows 视窗 操作 系统 ， 自 
Windows 95 以 来 ， 几 乎 垄断 了 所 有 的 PC 操作 系统 。 据 不 完全 统计 ， 目 前 Windows 7 以 及 
Windows XP 等 市 场 占有 率 超 过 九 成 。 尽 管 Windows Phone 手机 的 操作 系统 在 中 国 市 场 占 
有 率 不 高 ， 但 是 诺基亚 也 在 中 国 市 场 主推 其 装载 了 Windows Phone 操作 系统 的 智能 手机 。 

6) “苹果 逐步 扩大 影响 

根据 苹果 2012 年 财报 显示 ， 亚 太 地 区 的 收入 有 2/3 来 自 中 国 ， 上 一 财 季 销 售 总 额 为 
57 亿美 元 ， 相 比 去 年 同期 增长 了 48%。 苹 果 CEO Tim Cook 指出 ， 到 上 一 财 季 结束 ， 苹 果 
在 中 国 的 总 收入 为 124 亿美 元 ， 而 2011 年 一 年 的 收入 只 有 133 亿美 元 ， 而 这 些 数字 仍然 
在 以 难以 置信 的 速度 增长 。 目 前 iPad 在 中 国 的 市 场 中 占有 绝对 的 领先 地 位 ， 而 苹果 的 
iPhone 手机 也 在 中 国 市 场 中 有 着 很 高 的 占有 率 ， 而 苹果 的 笔记 本 电脑 等 在 中 国 市 场 的 销售 
额 也 在 不 断 增加 。 

7) “甲骨 文人 垄断 我 国 重要 行业 数据 库 市 场 

甲骨 文 1989 年 正式 进入 中 国 ， 建 立 北京 首 家 办 事 处 。 目 前 ， 甲 骨 文 中 国 已 拥有 2.5 万 
个 客户 ，4500 名 员工 ， 以 及 4 个 研发 中 心 。 经 过 20 余年 的 发 展 ， 目 前 在 中 国 市 场 上 的 甲 
骨 文 已 经 控制 了 90% 的 数据 库 市 场 。 

8) ”高 通 引领 移动 互联 网 时 代 

移动 互联 网 时 代 的 发 展 造就 了 高 通 。 高 通 目 前 在 手机 平板 等 移动 设备 中 占有 了 相当 大 
的 优势 地 位 。 根 据 iSuppli 调查 ， 高 通 2007 年 登 上 全 球 手机 芯片 龙头 地 位 后 ，2012 年 市 场 
占有 率 进一步 攀高 至 31%， 连 续 5 年 蝉联 全 球 手机 芯片 龙头 。 目 前 在 国内 的 知名 厂商 中 ， 
小 米 、 联 想 、 酷 派 等 大 多 采用 了 高 通 的 CPU。 


(OERD 大 效 所 金融 信息 安全 风险 


8.3.1 大 数据 金融 信息 安全 风险 的 类 型 
在 大 数据 时 代 ， 企 业 金 融 信息 安全 面临 的 风险 主要 有 法 律 风险 、 市 场 风险 、 技 术 风 
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险 、 操 作风 险 、 道 德 风险 等 方面 。 这 些 风险 与 大 数据 技术 的 发 展 相依 相 成 ， 有 些 风险 是 大 
数据 与 生 俱 来 的 固有 风险 ， 如 物理 环境 风险 和 技术 风险 等 ， 有 些 风险 受 大 数据 技术 的 外 部 
环境 所 影响 ， 如 法 律 风 险 等 ， 有 些 风 险 伴随 着 社会 进步 慢 慢 将 会 得 到 有 效 控制 ， 如 信息 泄 
密 风 险 等 。 

1. 法 律 风 险 

法 律 风险 是 企业 在 经 营 过 程 中 由 于 故意 或 过 失 违 反 法 律 义务 或 约定 义务 可 能 承担 的 责 
任 和 损失 。 

法 律 风 险 的 表现 形式 如 下 。 

(1) 金融 合约 不 能 受到 法 律 应 予 的 保护 而 无 法 履行 或 金融 合约 条 款 不 周密 。 

(2) 法 律 法 规 跟 不 上 金融 创新 的 步伐 ， 使 创新 金融 交易 的 合法 性 难以 保证 ， 交 易 一 方 
或 双方 可 能 因 找 不 到 相应 的 法 律 保护 而 遭受 损失 。 

(3) 形形色色 的 各 种 犯罪 及 不 道德 行为 对 金融 资产 安全 构成 威胁 。 

(4) 经 济 主 体 在 金融 活动 中 如 果 违 反 法 律 法 规 ， 将 会 受到 法 律 的 制裁 。 

在 大 数据 时 代 ， 由 于 相关 法 律 法 规 建 设 尚 不 健全 ， 存 在 很 多 监管 漏洞 ， 企 业 在 金融 信 
息 安 全 方面 面临 着 来 自 法 律 方面 的 风险 ， 简 单 而 言 ， 可 以 表现 为 以 下 两 个 方面 。 

(1) 大 数据 产业 文化 背景 带 来 法 律 风险 。 
国内 的 大 数据 产业 将 与 欧美 完全 不 同 ， 国 外 讲究 个 人 隐私 ， 有 严格 的 反 隐 私法 的 规 
定 。 而 东亚 文化 圈 对 上 网 “隐私 ”容忍 度 很 高 ， 相 关 法 律 机 制 也 不 健全 ， 也 给 了 一 些 大 数 
据 公司 和 互联 网 用 数据 牟利 带 来 了 “空间 ”。 这 跟 互 联网 行业 早期 发 展 与 国内 知识 产权 相 
对 宽松 氛围 相关 ， 整 个 行业 法 律 意识 相对 淡薄 ， 民 众 版 权 意识 薄弱 ， 知 识 产权 付费 使 用 的 
意识 不 强 。 但 是 在 互联 网 行业 已 经 相当 成 熟 的 今天 ， 法 律 不 健全 给 企业 带 来 的 大 数据 金融 
信息 安全 风险 显然 已 经 不 容 小 裔 。 

(2) 大 数据 产业 的 监管 漏洞 带 来 法 律 风险 。 

大 数据 是 把 双 刃 剑 ， 公 民 的 数据 信息 必须 得 到 依法 监管 ， 一 旦 出 现行 业 性 数据 安全 泄 
密 事 件 ， 将 会 让 相关 新 行业 陷入 危机 之 中 。 例 如 ， 智 能 家 居 数 据 泄密 将 会 造成 人 身 财产 安 
全 隐患 。 比 如 在 3 月 10 日 曝 出 一 起 某 互 联网 公司 员工 人 盗 取 50 亿 条 公民 数据 的 信息 。 这 
是 大 数据 崛起 前 最 大 的 绊脚石 ， 也 从 侧面 证 明了 大 数据 产业 所 处 的 原始 混乱 状态 。 在 这 种 
混乱 状态 下 ， 如 果 行业 监管 不 能 得 到 及 时 有 效 跟 进 ， 将 会 给 大 数据 产业 的 发 展 带 来 极 大 的 
阻碍 ， 给 金融 系统 带 来 法 律 风 险 和 极 大 的 安全 隐患 。 


2. 物理 环境 风险 


物理 环境 风险 是 指 企 业 利 用 大 数据 技术 进行 分 析 所 依托 的 信息 系统 设施 面临 的 物理 环 
境 遭 到 外 部 因素 影响 而 给 金融 信息 安全 带 来 的 风险 。 

这 些 外 部 因素 包括 基础 设备 故障 、 信 息 系统 故障 等 。 

(1) 基础 设备 故障 给 金融 信息 安全 带 来 的 风险 。 

大 数据 分 析 依 托 的 信息 系统 基础 设施 包括 支撑 业务 应 用 系统 的 网 络 (局 域 网 、 广 域 网 、 
互联 网 、 专 线 网 、 无 线 网 )、 硬 件 (服务 器 、 主 机 、 应 用 终端 、 共 享 设备 ) 和 物理 环境 ， 它 们 
是 组 织 业 务 赖 以 生存 的 基础 (如 电力 、Web 服务 器 、 数 据 库 服 务 器 等 )， 一 旦 出 现 故障 或 中 
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断 ， 它 所 承载 的 应 用 也 会 出 现 问题 或 停顿 。 基 础 设备 风险 要 求 组 织 在 应 用 层 、 网 络 层 、 链 
路 层 和 物理 层面 进行 综合 防御 。 

(2) 信息 系统 故障 给 金融 信息 安全 带 来 的 风险 。 

企业 的 计算 机 操作 系统 和 应 用 软件 在 组 织 业务 交流 的 运行 过 程 中 ， 需 要 一 个 十 分 安全 
稳定 的 内 部 环境 。 来 自 这 些 系统 和 应 用 软件 的 问题 和 缺陷 会 对 系统 造成 影响 ， 特 别 是 在 多 
个 应 用 系统 互联 时 ， 影 响 会 涉及 整个 组 织 的 多 个 系统 ， 甚 至 会 导致 整个 公司 或 网 站 瘫痪 。 
信息 系统 风险 要 求 机 构 对 系统 应 用 在 协同 、 系 统 维护 、 版 本 测试 、 版 本 管理 、 配 件 管理 、 
系统 管理 、 系 统 监控 等 方面 具备 管理 能 


3. 技术 风险 


大 数据 时 代金 融 信息 安全 面临 的 技术 风险 是 指数 据 在 获取 、 挖 掘 、 处 理 等 基本 环节 因 
技术 处 理 不 当 或 技术 设计 不 到 位 而 引致 的 风险 。 

对 数据 进行 收集 、 存 储 、 处 理 、 挖 掘 分 析 是 搜索 技术 的 基本 环节 。 人 金融 信 息 企业 主要 
相关 的 大 数据 技术 有 : 数据 采集 、 数 据 存储 、 数 据 处 理 、 数 据 挖掘 与 分 析 技术 等 。 

金融 信息 安全 所 面临 的 技术 风险 主要 体现 在 以 下 几 个 方面 。 

(1) 完整 性 风险 。 即 数据 未 经 授权 使 用 或 不 完整 或 不 准确 而 造成 的 风险 。 这 种 风险 通 
常 与 用 户 界面 的 设计 、 数 据 处 理 程序 、 灾 害 恢 复 程 序 、 数 据 控制 机 制 及 信息 安全 机 制 等 
有 关 。 

(2) 存 取 风险 。 即 系统 、 数 据 或 信息 存 取 不 当 而 导致 的 风险 。 在 互联 网 和 大 数据 日 益 
普及 的 今天 ， 存 取 风 险 是 企业 面临 的 主要 威胁 之 一 。 存 取 风 险 主 要 与 业务 程序 的 确立 、 应 
用 系统 的 安全 、 数 据 管理 控制 、 数 据 处 理 环境 、 网 络 安全 、 计 算 机 和 通信 设备 状况 等 
有 关 。 

(3) 获得 性 风险 。 即 影响 数据 或 信息 的 可 获得 性 的 风险 。 主 要 与 数据 处 理 过 程 的 动态 
监控 、 数 据 恢复 技术 、 备 份 和 应 急 计划 等 有 关 。 

(4) 体系 结构 风险 。 即 信息 技术 体系 结构 规划 不 合理 或 未 能 与 业务 结构 实现 调配 所 带 
来 的 风险 。 主 要 与 信息 技术 组 织 的 健全 、 信 息 安全 文化 的 培育 、 信 息 技 术 资 源 配置 、 信 息 
安全 系统 的 设计 和 和 运行、 计算 机 和 网 络 操作 环境 、 数 据 管理 的 内 在 统一 性 等 有 关 。 

(5) 其 他 相关 风险 。 即 其 他 影响 企业 业务 活动 的 技术 性 风险 。 主 要 与 信息 技术 对 业务 
目标 的 支持 、 业 务 流程 周期 、 存 货 预 警 系统 、 业 务 中 断 、 产 品 信息 反馈 系统 、 业 务 的 流动 
性 管理 等 有 关 。 

4. 信息 泄露 风险 


大 数据 时 代金 融 信息 安全 面临 的 泄密 风险 是 指数 据 在 获取 、 存 储 、 传 输 、 分 析 和 使 用 
等 过 程 中 发 生 信息 泄露 从 而 给 信息 相关 者 带 来 安全 隐患 的 风险 。 

信息 泄密 方式 主要 有 3 种 情况 : 黑客 入 侵 ， 用 户 信息 未 加 密 ; 企业 内 部 员工 窃 密 ， 服 
务 外 包 人 员 窃 密 。 其 中 ， 企 业 员工 内 部 泄密 对 企业 的 损害 程度 和 其 发 生 的 频 度 远 远 高 于 其 
他 外 部 攻击 窃 密 ， 更 是 防范 重点 。 信 息 作为 组 织 信息 技术 系统 装载 的 业务 数据 ， 是 一 种 具 
有 非常 重要 价值 的 资产 。 与 实物 资产 相 比 ， 信 息 非常 分 散 ， 并 且 容 易 被 复制 ， 信 息 是 组 织 
业务 流程 中 最 重要 的 数据 ， 如 客户 资料 、 产 品 设计 等 ， 如 果 不 能 得 到 正确 的 识别 、 评 估 、 
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保存 和 管理 ， 就 可 能 面临 被 窃取 、 损 毁 和 丢失 的 风险 ， 这 不 仅 会 对 依托 于 这 些 关键 信息 的 
核心 业务 造成 严重 破坏 ， 还 会 对 组 织 的 信誉 和 声望 造成 巨大 的 损害 ， 甚 至 会 摧毁 整个 
组 织 。 
近年 来 ， 国 内 网 络 犯罪 案件 呈现 逐年 上 升 的 态势 ， 其 中 涉及 金融 业 特别 是 银行 信息 安 
全 方面 的 犯罪 也 不 在 少数 。 例 如 ，2014 年 2 月 支付 宝 员工 在 信息 系统 的 后 台 下 载 了 大 量 客 
户 信息 有 偿 出 售 给 其 他 电 商 公司 ; 2016 年 相继 发 生 的 携程 信用 卡 信息 泄露 、 小 米 社区 用 户 
信息 泄露 等 事件 中 ， 出 现 了 大 量 用 户 信息 数据 被 盗 ， 导 致 用 户 网 络 银行 账户 被 入 侵 事 件 
等 。 上 述 事件 严重 影响 了 金融 消费 者 的 合法 权益 ， 也 充分 暴露 出 在 网 络 信息 安全 领域 有 较 
大 隐患 ， 不 容 小 遍 。 


8.3.2 ”大 数据 金融 信息 安全 风险 的 特征 


大 数据 技术 的 不 断 发 展 为 金融 市 场 风险 监控 提供 了 有 效 的 技术 支撑 ， 因 而 在 大 数据 时 
代 ， 人 金融 信息 安全 的 风险 有 着 比 传统 金融 信息 安全 风险 更 为 鲜明 的 特征 。 在 大 数据 时 代 ， 
金融 信息 安全 风险 具有 扩散 性 强 、 影 响 面 广 和 风险 评估 难 的 特点 。 


1. 扩散 性 强 


由 于 大 数据 具有 Velocity( 获 取 及 处 理 速度 极 快 ) 的 特点 ， 在 大 数据 时 代 ， 数 据 的 获取 是 
随时 随地 进行 的 ， 与 此 同时 ， 数 据 的 处 理 也 是 飞速 的 。 在 大 数据 的 处 理 过 程 中 ， 如 果 某 个 
细微 的 环节 出 现 错误 ， 这 种 错误 将 会 以 极 快 的 速度 蔓延 开 ， 扩 散 能 力 极 强 。 这 是 大 数据 技 
术 与 传统 海量 数据 处 理 的 重要 区 别 之 一 。 

大 数据 时 代 下 金融 信息 安全 风险 扩散 性 强 主要 体现 在 以 下 几 个 方面 。 

(1) 大 数据 技术 使 得 金融 机 构 获取 海量 数据 的 过 程 变 得 简单 和 便捷 ， 数 据 的 获取 随时 
随地 都 在 进行 。 我 们 在 浏览 网 页 时 的 任何 停留 都 能 够 迅速 被 大 数据 技术 捕捉 并 记录 在 数据 
库 中 。 如 果 有 黑客 等 恶意 制造 大 量 虚假 数据 ， 这 些 可 以 制造 的 数据 将 会 迅速 传播 到 各 数据 
分 析 中 心 ， 这 种 虚假 数据 的 传播 将 会 带 来 极 大 的 金融 信息 风险 ， 而 且 这 种 风险 将 会 以 极 快 
的 速度 扩散 。 

(2) 在 大 数据 技术 的 应 用 下 ， 金 融 机 构 处 理 交 易 数据 和 客户 数据 等 的 速度 和 量 有 了 质 
的 提升 ， 机 构 运 行 效率 提升 。 如 果 前 面 获取 的 数据 存在 问题 ， 数 据 处 理 时 将 会 得 出 大 量 错 
误 的 结论 。 由 于 大 数据 处 理 关 注 相 关 关 系 而 不 是 因果 关系 ， 在 处 理 数据 时 将 很 难 发 现 有 意 
而 为 之 的 数据 错误 ， 这 种 问题 带 来 的 风险 将 会 以 极 快 的 速度 传播 到 整个 数据 传输 通道 。 

(3) 随 着 互联 网 的 普及 和 大 数据 的 发 展 ， 人 们 获取 信息 变 得 更 加 容易 ， 沟 通 方式 变 得 
更 加 便捷 ， 消 费 与 购物 方式 也 摆脱 了 物理 形态 ， 通 过 线 上 支付 ， 几 秒 钟 就 能 实现 商品 交 
易 。 若 消费 者 信息 被 黑客 恶意 盗用 ， 这 种 大 体 量 的 数据 风险 将 会 随 着 便捷 的 交易 媒介 迅速 
扩散 ， 严 重 危害 到 金融 信息 安全 。 


2. 影响 面 广 


金融 领域 对 信息 变化 的 反应 极为 敏感 。 由 于 大 数据 具有 体 量 大 、 传 播 速 度 快 等 特征 ， 
金融 市 场 上 一 些 很 细微 的 操作 能 被 迅速 放大 并 广泛 传播 ， 产 生 “ 蝴 蝶 效 应 ”， 可 能 会 对 资 
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本 市 场 产 生 很 大 的 冲击 ， 影 响 面 极为 广泛 。 大 数据 时 代 下 金融 信息 安全 风险 影响 面 广 主要 
体现 在 以 下 两 个 方面 。 

(1) 在 金融 领域 ， 数 据 与 信息 的 传递 速度 特别 快 ， 金 融 市 场 对 外 界 信息 的 反应 程度 极 
大 。 由 于 金融 全 球 化， 一 国 金融 市 场 上 极 小 的 变动 都 可 能 会 对 全 球 金融 市 场 上 产生 重大 影 
响 。 在 大 数据 时 代 ， 这 样 的 影响 尤其 显著 。 人 金融 市 场 具有 极 强 的 外 部 性 ， 容 易 受 外 界 信息 
的 干扰 。 

(2) 大 数据 技术 给 金融 机 构 带 来 技术 革命 ， 目 前 许多 机 构 分 析 数 据 都 依赖 于 大 数据 技 
术 。 依 靠 大 数据 技术 ， 金 融 机 构 能 在 极 短 时 间 内 对 金融 市 场 上 的 信号 做 出 反应 。 大 数据 技 
术 处 理 数据 体 量 大 ， 速 度 快 ， 从 发 现 错误 到 形成 实质 性 损失 之 间 的 时 间 极 短 ， 加 上 金融 市 
场 本 身 固有 的 脆弱 性 ， 使 得 大 数据 时 代 ， 金 融 信息 安全 风险 影响 力 被 快速 放大 。 


3. 风险 评估 难 


从 金融 信息 安全 的 角度 来 讲 ， 风 险 评 估 是 对 金融 信息 资产 所 面临 的 威胁 、 存 在 的 弱 
点 、 造 成 的 影响 ， 以 及 三 者 综合 作用 所 带 来 风险 的 可 能 性 的 评估 。 风 险 评估 的 主要 任务 包 
括 : 识别 评估 对 象 面临 的 各 种 风险 ; 评估 风险 概率 和 可 能 带 来 的 负面 影响 ， 确 定 组 织 承受 
风险 的 能 力 ， 确 定 风险 消减 和 控制 的 优先 等 级 ， 推 荐 风险 消减 对 策 。 信 息 技术 软 硬 件 漏洞 
是 全 球 各 类 信息 安全 问题 的 主要 源头 之 一 ， 对 大 数据 技术 带 来 的 金融 信息 安全 风险 评估 首 
先 在 技术 上 具有 很 大 难度 。 另 外 ， 就 目前 而 言 ， 并 没有 一 套 完善 的 基于 大 数据 技术 带 来 的 
金融 信息 安全 风险 评估 模型 。 

大 数据 时 代 下 金融 信息 安全 风险 评估 难 主要 体现 在 以 下 几 个 方面 。 

(1) 从 风险 揭示 层面 出 发 ， 关 于 大 数据 与 金融 信息 安全 的 相关 法 律 尚 不 明确 ， 存 在 很 
多 监管 漏洞 。 就 目前 而 言 ， 大 数据 技术 是 一 项 前 沿 技术 ， 大 数据 金融 与 其 他 领域 的 概念 可 
能 会 发 生 重合 ， 导 致 风险 揭示 不 清晰 ， 风 险 披露 不 明朗 。 依 托 互联 网 ， 大 数据 的 监管 更 加 
困难 ， 各 国 目前 也 正在 积极 出 台 关 于 大 数据 金融 的 监管 条 例 。 

(2) 从 风险 评估 步 又 层面 出 发 ， 风 险 评 估 包 括 风险 辨识 、 风 险 分 析 、 风 险 评价 3 个 步 
了 又。 风险 辨识 是 指 查 找 企 业 各 业务 单元 、 各 项 重要 经 营 活动 及 其 重要 业务 流程 中 有 无 风 
险 ， 有 哪些 风险 。 风 险 分 析 是 对 辨识 出 的 风险 及 其 特征 进行 明确 的 定义 描述 ， 分 析 和 描述 
风险 发 生 可 能 性 的 高 低 、 风 险 发 生 的 条 件 。 风 险 评价 是 评估 风险 对 企业 实现 目标 的 影响 程 
度 、 风 险 的 价值 等 。 在 大 数据 技术 广泛 运用 的 金融 机 构 ， 从 信息 采集 到 数据 分 析 再 到 生成 
分 析 结果 ， 大 数据 技术 的 应 用 贯穿 风险 评估 的 每 个 步骤 。 

(3) 从 风险 评估 过 程 层面 出 发 ， 在 风险 评估 过 程 中 ， 有 几 个 关键 的 问题 需要 考虑 。 
巴 要 确定 保护 的 对 象 (或 者 资产 ) 是 什么 ? 它 的 直接 和 间接 价值 如 何 ? 如 资产 面临 哪些 潜在 
威胁 ? 导致 威胁 的 问题 所 在 ? 威胁 发 生 的 可 能 性 有 多 大 ? @@ 资 产 中 存在 哪些 弱点 可 能 会 被 
威胁 所 利用 ? 利用 的 容易 程度 又 如 何 ? @ 一 旦 威胁 事件 发 生 ， 组 织 会 遭受 怎样 的 损失 或 者 
曾 临 怎样 的 负面 影响 ?@@ 组 织 应 该 采取 怎样 的 安全 措施 才能 将 风险 带 来 的 损失 降低 到 最 低 
程度 ? 解决 以 上 问题 的 过 程 ， 就 是 风险 评估 的 过 程 。 在 大 数据 时 代 ， 这 种 金融 信息 安全 风 
险 往往 十 分 隐蔽 ， 上 述 在 风险 评估 过 程 中 的 问题 很 难得 到 完全 的 解决 。 

在 大 数据 时 代 ， 金 融 市 场 自动 化 交易 发 展 迅 速 ， 利 用 强大 的 计算 机 处 理 能 力 ， 根 据 交 
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易 模 型 发 出 算法 指令 ， 具 有 单 笔 报 单 小 、 报 单 总 笔 数 高 、 时 间 间 隔 短 、 报 单 撤 单 比 高 等 特 
点 。 自 动 化 交易 提高 了 市 场 流动 性 和 价值 发 现 效率 ， 但 也 带 来 一 系列 风险 ， 且 由 于 交易 量 
庞大 ， 交 易 时 间 迅 速 ， 交 易 范围 广 ， 所 带 来 的 金融 信息 安全 风险 影响 迅速 扩大 。 在 美国 期 
货 交 易 所 中 ， 自 动 化 交易 成 交 量 占 总 交易 量 的 一 半 以 上 。 由 于 自动 化 交易 普遍 采用 止 损 策 
略 ， 当 市 场 出 现 大 幅 波动 时 ， 会 自动 触发 一 系列 相关 金融 产品 的 连锁 交易 ， 从 而 引发 市 场 
多 米 诺 效应 。 在 大 数据 时 代 ， 由 于 金融 信息 安全 风险 的 扩散 性 强 、 影 响 面 广 、 风 险 评 估 难 
的 特点 ， 这 种 高 频 交易 很 有 可 能 会 迅速 导致 金融 市 场 全 线 衣 盘 ， 引 发 资本 市 场 剧 烈 波动 。 

在 美国 关于 大 数据 与 自动 化 交易 最 著名 的 案例 就 是 2010 年 5 月 6 日 发 生 的 “闪电 月 
盘 ” 事 件 。 由 于 一 家 交易 公司 电脑 发 出 错误 指令 ， 导 致 大 量 自动 化 交易 自动 止 损 ， 道 琼斯 
工业 指数 在 30 分 钟 内 狂 挫 千 点 ， 市 值 损失 上 万 亿美 元 。2013 年 4 月 3 日 ， 黑 客 劫持 美 联 
社 的 推 特 账号 ， 发 布 了 美国 白宫 发 生 爆 炸 、 总 统 奥 巴 马 受伤 的 假 消息 ， 金 融 市 场 瞬 间 出 现 
恐慌 性 抛售 ， 道 琼斯 工业 指数 在 3 分 钟 内 下 跌 超过 140 点 ， 市 值 损失 近 1400 亿美 元 。 
2013 年 8 月 6 日 ， 光 大 证 券 由 于 自动 化 交易 平台 缺陷 ， 发 送 错 误 指令 导致 上 证 指数 在 26 
秒 内 狂 涨 100 点 ， 造 成 国内 资本 市 场 剧 烈 波动 。 

上 述 案 例 均 表 明 ， 大 数据 在 给 金融 市 场 带 来 前 所 未 有 的 巨大 发 展 的 同时 ， 还 会 带 来 金 
融 信息 安全 风险 ， 在 大 数据 时 代 ， 这 种 风险 由 于 有 具有 扩散 性 强 、 影 响 面 广 而 且 风 险 评估 
难 ， 给 金融 市 场 带 来 很 大 的 挑战 。 


8.3.3 国内 外 金融 信息 安全 事件 及 事故 
1. 信息 安全 事件 


信息 安全 事件 是 指 识别 出 发 生 的 系统 、 服 务 或 网 络 事件 ， 表 明 可 能 违反 信息 安全 策略 
或 防护 措施 失效 ， 或 以 前 未 知 的 与 安全 相关 的 情况 。 

对 于 金融 信息 安全 事件 ， 由 于 金融 业 多 金 的 本 质 ， 长 期 以 来 ， 全 球 各 类 非法 组 织 、 不 
法 分 子 不 断 研究 和 尝试 运用 各 种 先进 技术 手段 ， 利 用 金融 企业 管理 和 金融 信息 系统 的 信息 
安全 缺陷 和 脆弱 性 ， 策 划 和 组 织 金融 犯罪 活动 ， 资 金 损失 、 信 息 泄密 事件 层出不穷 。 此 
外 ， 人 金融 业 一 些 内 部 从 业 人 员 ， 也 因为 利益 的 驱使 ， 突 破 道德 底线 ， 从 内 部 窃取 数据 或 越 
权 操 纵 ， 导 致 安全 堡垒 从 内 部 被 攻破 ， 内 外 安全 问题 夹击 ， 使 金融 业 信 息 安 全 更 加 危机 
四 伏 。 

2. 信息 安全 事故 


舍 息 安全 事故 是 指 一 个 或 系列 非 期 望 的 或 非 预期 的 信息 安全 事件 ， 这 些 信息 安全 事件 
可 能 对 业务 运营 造成 严重 影响 或 威胁 信息 安全 。 

对 于 金融 信息 安全 事故 ， 金 融 信息 化 建设 促进 金融 业 信息 化 程度 高 度 发 达 ， 但 由 于 核 
心 业务 和 核心 数据 高 度 依赖 信息 系统 ， 系 统 任 一 环节 的 运行 故障 或 操作 失误 都 可 能 会 造成 
严重 事故 ， 关 键 数据 的 损失 可 能 会 对 金融 企业 和 金融 行业 造成 致命 打击 。 而 信息 系统 运 维 
失误 、 外 部 因素 导致 的 系统 运行 连续 性 事故 往往 是 产生 金融 信息 安全 事故 的 主要 来 源 。 
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3. 国内 外 金融 信息 安全 案例 
表 8.3 收集 了 互联 网 上 公布 的 近 4 年 来 全 球 范围 发 生 的 金融 信息 安全 事件 和 事故 。 


年 度 


表 8.3 近 几 年 来 全 球 金融 信息 安全 事件 和 事故 
信息 安全 事件 


2016 


2015 


2014 


2013 


环球 银行 金融 电信 协会 (SWIFT) 信 息 系统 发 生 多 起 网 络 入 侵 盗窃 事件 。2016 年 2 月 ， 网 络 黑 
客 入 侵 孟 加 拉 国 中 央 银 行窃 取 8100 万 美元 ，2016 年 6 月 ， 黑 客 攻 破 乌克兰 银行 核心 网 络 系 
统 ， 盗 取 1000 万 美元 。 几 宗 案件 的 作案 手法 十 分 雷同 ， 均 为 黑客 通过 入 侵 银 行 账户 系统 ， 
植 入 网 络 木马 程序 ， 盗 取 转 账 凭 证 ， 并 算 改 SWIFT 文件 ， 控 制 交易 流程 

大 型 医疗 保险 商 CareFirst 遭遇 专业 黑客 攻击 ， 约 有 110 万 医疗 保险 客户 的 个 人 信息 遭 泄 
， 包 括 客户 的 个 人 姓名 、 生 日 、 邮 箱 地 址 、 医 疗 保险 号 码 等 信息 ， 部 分 信息 被 发 现 遭 到 非 
利用 。 

国 证 券 服务 商 Scottrade 发 生 了 信息 系统 数据 泄露 事故 。 数 百 万 用 户 的 敏感 数据 受到 影响 ， 
受 影响 的 数据 库 中 包含 用 户 的 社会 安全 号 码 和 电子 邮件 地 址 。 

汇丰 银行 由 于 内 部 控制 原因 ， 大 量 秘密 银行 账户 文件 被 非法 盗 取 ， 涉 及 约 3 万 个 账户 ， 总 计 
1200 亿美 元 资产 

英格兰 银行 大 额 支付 系统 (CHAPS) 故 障 导 致 系统 宕 机 长 达 10h， 事 故 当日 积压 大 量 交易 数 
据 ， 政 府 、 商 业 和 个 人 的 支付 业务 受到 严重 干扰 ， 对 英国 的 经 济 造成 重大 影响 。 

欧洲 中 央 银 行 (ECB) 遭 到 严重 的 网 络 攻 击 ， 网 络 黑客 通过 其 外 部 网 站 的 数据 库 ， 窃 取 了 网 站 
上 1.5 亿 注 册 者 的 电子 邮件 和 用 户 的 个 人 信息 ， 包 括 电 子 邮件 、 家 庭 住 址 和 电话 号 码 在 内 的 
部 分 未 加 密 数 据 被 非法 利用 。 

美国 第 二 大 零售 商家 得 宝 (Home Depot) 公 司 支付 系统 遭 到 网 络 攻击 ， 近 5600 万 张 银行 卡 的 信 
息 被 盗 ， 比 2013 年 美国 塔 吉 特 (Target Group) 发 生 的 客户 银行 卡 数据 被 盗 事件 更 加 严重 。 
摩根 大 通 银行 7600 万 家 庭 和 700 万 小 型 企业 的 相关 信息 被 位 于 南欧 的 网 络 黑客 盗 取 ， 涉 及 银 
行 客户 的 姓名 、 住 址 、 电 话 号 码 和 电邮 地 址 等 个 人 信息 ， 与 这 些 用 户 相关 的 内 部 银行 信息 也 遭 
到 泄露 

2013 年 6 月 23 日 ， 中 国 工商 银行 上 海 数据 中 心 主机 运 维 失误 ， 造 成 国内 多 地 的 网 点 柜 面 、 
ATM、 网 银 业 务 出 现 故障 ， 无 法 办 理 业 务 和 提供 资金 服务 ， 故 障 时 间 持 续 1h， 故 障 涉及 北 
京 、 上 海 、 广 州 、 武 汉 、 哈 尔 滨 等 多 个 大 中 型 城市 ， 造 成 较 大 影响 


【案例 】 数 据 泄露 

2015 年 是 数据 安全 事故 频 发 年 ， 也 是 数据 安全 防护 技术 高 速 发 展 的 一 年 。 回 顾 整 个 
2015 年 ， 产 业 信 息 化 、 数 字 化 、 网 络 化 进程 加 速 ，“ 互 联网 +” 已然 成 为 一 种 不 可 逆 的 趋 
势 ， 互 联网 、 云 计算 、 大 数据 带 来 更 新 式 革命 ， 然 而 新 趋势 下 的 数据 安全 状况 变 得 越发 严 
峻 。Verizon 新 发 布 的 《2015 数据 泄露 调查 报告 》 显 示 ，500 强 企业 中 超 半 数 曾 遭 受过 黑 
客 攻击 。 来 自 中 国 的 数据 安全 问题 更 加 触目 惊 心 。 福 布 斯 上 榜 的 中 国企 业 中 ， 大 多 数 企业 
都 曾经 不 同 程度 遭受 过 攻击 或 出 现 数据 泄露 ， 特 别 是 一 些 掌握 大 量 民 众 个 人 信息 的 通信 运 
营 商 及 金融 领域 。 表 8.4 汇总 了 2015 年 国内 外 十 大 最 具 影 响 力 的 数据 泄密 事件 。 
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表 8.4 ”2015 年 十 大 国内 外 数据 泄露 时 间 汇 总 
序 企业 了 曝光 时 间 泄露 原因 泄露 结果 
号 


二 万 级 的 酒店 顾客 敏感 信息 泄露， 包括 
姓名 、 身 份 证 、 家 庭 住址 、 手 机 号 、 信 
用 卡 等 

大 量 秘密 银行 账户 文件 被 曝光 ， 涉 及 约 
3 万 个 账户 ， 总 计 约 1200 亿美 元 资产 
数 干 万 人 员 的 身份 证 、 社 保 参 保 信息 、 
财务 薪酬 、 房 屋 等 敏感 信息 

4 | 工商 银行 快捷 支付 | 2015.06 多 位 北京 地 区 的 工行 储户 存款 被 次 


意大利 监控 厂商 400GB 内 部 数据 泄露 ， 并 可 在 互联 网 公 
: 遭受 黑客 攻击 
Hacking Team J 开 下 载 和 传播 
国 婚外情 网 站 
6 i | 2015.08.18 | 遭受 黑客 攻击 3700 万 名 用 户 资料 泄露 
Ashiey Madison 


240 万 用 户 个 人 数据 及 9 万 名 客户 加 密 
英 言 运营 .08. 遭受 黑客 攻击 
Ea 国电 信 运 营 商 2015.08.09 信用 卡 数据 外 浊 


600 余 万 用 户 账户 密码 泄露 ， 并 被 售卖 


网 站 存在 漏洞 ， 
遭受 黑客 攻击 


十 大 知名 连锁 酒店 | 2015.02.11 


2 | 汇丰 银行 瑞士 分 支 | 2015.02.22 | 内 部 违规 


3 | 国内 社保 系统 2015.04.22 | 大 量 高 危 漏洞 


8 | 大 麦 网 2015.08.27 | 存在 安全 漏洞 


与 传播 
6 套 系统 沦陷 ， 涉 及 6000 万 客户 、6 万 
家 旅游 局 在 漏洞 
| | 多 旅行 社 账 号 密码 、 百 万 导游 信息 


5 实名 认证 信息 下 黄 个 来 
10 | 支付 宝 实名 认证 2016.10 存在 漏洞 po 和 


1. 十 大 知名 连锁 酒店 泄露 大 量 房客 开房 信息 


2 月 11 日 ， 据 漏洞 盒子 白 帽 子 提交 的 报告 显示 ， 知 名 连锁 酒店 桔子 、 锦 江 之 星 、 速 
八 、 布 丁 ， 高 端 酒店 万 豪 ( 丽 思 卡 尔 顿 酒店 等 )、 喜 达 屋 (喜来 登 、 艾 美酒 店 等 )、 洲 际 (假日 
酒店 等 ) 网 站 存在 高 危 漏 洞 一 一 房客 开房 信息 大 量 泄露 ， 一 览 无 余 ， 黑 客 可 轻松 获取 到 千 万 
级 的 酒店 顾客 的 订单 信息 ， 包 括 顾客 姓名 、 身 份 证 、 手 机 号 、 房 间 号 、 房 型 、 开 房 时 间 、 
退 房 时 间 、 家 庭 住址 、 信 用 卡 后 四 位 、 信 用 卡 截 止 日 期 、 邮 件 等 大 量 敏感 信息 。 

2. 汇丰 发 生 史 上 最 大 规模 银行 泄密 

2 月 12 日 ， 汇 丰 银 行 大 量 秘 密 银行 账户 文件 被 上 曝光， 显示 其 瑞士 分 支 帮助 富有 客户 逃 
税 ， 隐 瞒 数 百 万 美元 资产 ， 提 取 难 以 追踪 的 现金 ， 并 向 客户 提供 如 何在 本 国 避 税 的 建议 
等 。 这 些 文件 覆盖 的 时 间 为 2005 年 至 2007 年 ， 涉 及 约 3 万 个 账户 ， 这 些 账户 总 计 持 有 约 
1200 亿美 元 资产 ， 堪 称 史 上 最 大 规模 银行 泄密 。 
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3. 多 省 社保 信息 遭 汇 露 ， 数 千 万 个 人 隐私 泄密 

4 月 22 日 消息 ， 近 日 大 量 社保 系统 相关 漏洞 出 现在 补 天 漏洞 响应 平台 ， 网 站 信息 显示 
深圳 、 上 海 、 河 北 、 河 南 、 山 西 、 安 徽 等 省 市 卫生 和 社保 系统 出 现 大 量 高 危 漏 洞 。 数 据 显 
示 ， 围 绕 社保 、 公 务 员 等 信息 系统 的 漏洞 超过 30 个 ， 涉 及 人 员 数 量 达 数 千 万 ， 其 中 包括 
个 人 身份 证 、 社 保 参 保 信息 、 财 务 、 薪 酬 、 房 屋 等 敏感 信息 。 

4. 工行 快捷 支付 存 漏洞 ， 用 户 存款 消失 

6 月 ， 工 行 快捷 支付 被 曝 存 在 严重 漏洞 ， 多 位 北京 地 区 的 工行 储户 遭遇 了 存款 被 盗 寻 
件 。 犯 罪 分 子 借助 非法 途径 截获 短信 验证 码 ， 轻 而 易 举 地 盗窃 存款 。 

5. Hacking Team 被 黑 ，“ 互 联网 军火 ”泄露 

7 月初 ， 有 “互联 网 军火 库 ” 之 称 的 意大利 监控 软件 厂商 Hacking Team 被 黑客 攻击 ， 
400GB 内 部 数据 泄露 。 据 了 解 ，Hacking Team 掌握 的 大 量 漏 洞 和 攻击 工具 也 暴露 在 这 
400GB 数据 中 。 更 可 怕 的 是 ， 泄 露 的 数据 可 以 在 互联 网 上 公开 下 载 和 传播 。 

6. 婚外情 网 站 Ashley Madison 遭 攻 击 3700 万 名 用 户 资料 泄露 

8 月 ， 美 国 婚外情 网 站 “ 阿 什 莉 。 麦 迪 逊 ”(Ashley Madison) 在 全 世界 拥有 3700 万 名 
注册 会 员 ， 被 称 为 “婚外情 界 的 谷歌 ”。 不 明 身份 的 黑客 18 日 在 网 络 上 公布 了 这 些 会 员 
的 详细 资料 ， 称 此 举 是 为 逼 停 网 站 。 黑 客 公布 的 资料 显示 ， 会 员 中 包括 英国 公务 员 、 美 国 
银行 家 和 军人 以 及 联合 国 维和 人 员 等 。 

7. 英国 240 万 网 络 用 户 遭 黑客 侵袭 : 加 密 信用 卡 数据 外 泄 

8 月 9 日 ， 英 国电 信 运 营 商 Carphone Warehouse 在 黑客 入 侵 事 件 中 ， 包 含 加密 信 用 卡 
数据 的 约 240 万 在 线 用 户 的 个 人 信息 遭 到 黑客 入 侵 。 这 240 万 用 户 的 个 人 数据 包括 姓名 、 
地 址 、 出 生日 期 和 银行 卡 细节 …… 都 有 可 能 遭 到 黑客 访问 ， 其 中 多 达 9 万 名 客户 的 加 密 信 
用 卡 数 据 可 能 也 遭 到 黑客 入 侵 。 

8. 大 麦 网 600 多 万 用 户 账号 密码 泄露 ， 数 据 已 被 售卖 

8 月 27 日 消息 ， 乌 云 漏洞 报告 平台 发 布 报告 显示 ， 线 上 票务 营销 平台 大 麦 网 被 发 现存 
在 安全 漏洞 ，600 多 万 用 户 账户 密码 遭 到 泄露 。 这 些 隐私 数据 甚至 已 被 黑 产 行业 进行 售卖 
与 传播 。 

9. 国家 旅游 局 漏洞 致 6 套 系统 沦陷 ， 涉 及 全 国 6000 万 客户 

该 漏洞 于 国庆 长 假 前 夕 被 补 天 漏洞 响应 平台 披露 ， 涉 及 全 国 6000 万 客户 、6 万 多 旅行 
社 账号 密码 、 百 万 导游 信息 ; 并 且 攻 击 者 可 利用 该 漏洞 进行 审核 、 拒 签 等 操作 。 通 过 该 漏 
洞 ， 安 全 工作 者 获取 了 一 则 长 长 的 名 单 ， 能 够 直接 观看 到 每 位 用 户 的 详细 行程 及 个 人 
信息 。 

10. 支付 宝 实 名 认证 漏洞 

10 月 ， 支 付 宝 实名 认证 存在 漏洞 。 登 录 支 付 宝 后 无 意 间 打开 支付 宝 实名 认证 页 面 ， 用 
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户 的 实名 认证 信息 下 多 出 了 5 个 未 知 账户 ， 而 且 用 户 没 收 到 任何 形式 的 确认 或 是 告知 信 
息 ， 不 论 是 短信 、 邮 件 或 者 是 登录 后 的 站 内 信息 都 没有 。 

从 上 述 总 结 的 政 企 数据 泄密 事件 来 看 ， 主 要 的 泄密 风险 除了 黑客 攻击 、 木 马 病毒 、 钓 
鱼网 站 等 外 部 因素 ， 缺 乏 整套 行 之 有 效 的 安全 管理 系统 、 内 部 员工 泄密 以 及 内 部 管理 等 内 
部 因素 成 为 引发 的 数据 泄密 事件 的 主要 诱因 。 泄 密 领 域 也 进一步 扩大 ， 掌 握 大 量 民众 个 人 
信息 的 金融 行业 依旧 是 数据 泄露 的 “ 重 灾区 ”。 在 “互联 网 +” 时 代 ， 企 业 面临 的 安全 挑 
战 会 越 来 越 严峻 。 随 着 大 数据 、 云 计算 以 及 移动 互联 网 的 高 度 融合 ， 对 数据 安全 技术 提出 
了 更 高 的 要 求 ， 泄 密 事件 将 呈 高 发 势头 。 


(OD 再 更 区 我 国 金 融 信息 安全 现状 及 制约 因素 


8.4.1 我 国 金融 信息 安全 现状 

1. 国家 对 金融 行业 信息 安全 的 重视 程度 不 断 提 高 

从 政策 方面 看 ， 党 和 国家 领导 人 多 次 就 金融 行业 信息 安全 做 出 重要 指示 ， 要 求 金融 业 
研究 和 把 握 又 好 又 快 的 发 展 规律 ， 努 力 提高 信息 安全 保障 水 平 ， 坚 决 打击 危害 金融 信息 安 
全 的 犯罪 活动 。 

从 资金 支持 方面 看 ， 多 年 来 国家 发 展 改革 委 等 部 门 针 对 金融 行业 信息 安全 的 实际 需 
要 ， 重 点 支持 金融 信息 安全 产品 研发 和 应 用 等 。 专 项 资金 的 支持 在 一 定 程度 上 有 助 于 提升 
金融 领域 信息 安全 专业 化 服务 水 平 。 

例如 ，2013 年 8 月 国家 发 展 改革 委 发 布 《 国 家 发 展 改革 委 办 公 厅 关于 组 织 实施 2013 
年 国家 信息 安全 专项 有 关 事项 的 通知 》， 对 金融 信息 安全 领域 内 的 金融 领域 智能 入 侵 检测 
产品 、 面 向 电子 银行 的 Web 漏洞 扫描 产品 等 予以 重点 支持 。2012 年 ， 国 家 发 改 委 发 布 
《国家 发 展 改革 委 办 公 厅 关于 组 织 实施 2012 年 金融 领域 安全 IC 卡 和 密码 应 用 专项 有 关 事 
项 的 通知 》， 对 金融 领域 安全 IC 卡 和 密码 相关 关键 产品 的 产业 化 予以 重点 支持 。2016 年 
11 月 7 日, 全 国人 大 常委 会 表决 通过 《中 华人 民 共和 国 网 络 安全 法 》， 该 法 将 于 2017 年 
6 月 1 日 起 施行 。《 网 络 安全 法 》 也 必 将 对 金融 业 的 发 展 产生 深远 的 影响 。 

2. 初步 建立 以 “一 行 三 会 ”为 主 的 信息 安全 组 织 保障 机 制 

中 国人 民 银 行 着 重 健全 金融 信息 安全 保障 体系 ， 联 合 公安 部 、 安 全 部 、 工 业 和 信息 化 
部 、 电 监 会 四 部 委 共 同 制 定 《 金 融 业 信息 安全 协调 工作 预案 》， 发 布 《网 络 和 信息 系统 应 
急 预 案 编制 指引 》， 针 对 区 域 性 电力 和 通信 中 断 建立 联合 预警 、 快 速 处 置 流程 ， 并 指导 省 
级 区 域 建立 信息 安全 应 急 协调 机 制 。 

银监会 将 金融 业 信 息 技 术 风 险 纳入 审慎 监管 整体 框架 。 以 《商业 银行 信息 科技 风险 管 
理 指引 》 为 核心 ， 建 立 了 针对 突 发 事件 、 业 务 连续 性 、 科 技 外 包 等 的 监管 制度 ， 实 施 信息 
科技 现场 检查 和 非 现场 监管 ， 推 荐 监管 评级 ;同时 建立 与 公安 机 关 、 中 国 银联 、 电 力 、 电 
信 、 证 券 等 部 门 以 及 重要 信息 系统 服务 商 的 安全 突 发 事件 应 急 协 调 机 制 ， 加 强 情报 交流 与 
技术 协作 ， 提 高 信息 安全 协同 保障 能 力 。 
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证 监 会 制定 并 采取 了 “纵深 防御 ， 平 战 结合 ”的 防护 策略 ， 建 立 健全 信息 安全 监管 制 
度 的 同时 ， 推 进行 业 技 术 基 础 设施 建设 ， 实 现 了 全 行业 数据 集中 备份 ， 在 应 急 响 应 方面 开 
展 信息 安全 应 急 演练 ， 不 断 提 高 应 急 处 置 能 力 。 

保监会 在 落实 国家 信息 安全 等 级 保护 的 基础 上 从 多 方面 加 强 信息 安全 监管 体系 建设 。 
一 是 早 在 2008 年 就 发 布 了 《保险 业 信息 系统 灾难 恢复 管理 指引 》， 又 于 2011 年 出 台 《 保 
险 公 司 信息 系统 安全 管理 指引 (试行 )》， 对 客户 信息 安全 也 出 台 了 相关 办 法 并 加 强 管理 ， 
同时 还 建立 保险 信息 安全 风险 评估 指标 体系 。 二 是 建立 跨 部 委 合作 机 制 ， 制 定 应 急 协调 预 
案 ， 加 强 安 全 协调 与 通报 工作 。 三 是 开展 保险 业 信息 系统 安全 大 检查 ， 查 补漏 洞 ， 提 高 应 
急 处 置 能 力 。 


3. 以 密码 技术 和 身份 认证 为 主 的 安全 技术 保障 能 力 不 断 加 强 


当前 基于 PKI 的 信息 安全 产品 已 经 成 为 保障 我 国 金融 行业 信息 安全 的 有 力 武器 。 

(1) 金融 机 构 利用 PKI 机 制 可 以 实现 用 户 身份 的 鉴别 ， 基 于 PKI 技术 的 数字 证 书 已 经 
成 为 保障 网 络 金融 交易 的 主要 工具 。 通 过 PKI 技术 加 强身 份 认证 、 严 格 控制 登录 者 的 操作 
权限 ， 实 现 对 操作 系统 和 应 用 系统 严格 的 授权 管理 和 访问 控制 机 制 。 

(2) 通过 采用 服务 器 证 书 可 以 实现 对 网 站 的 可 信 性 认证 ， 有 效 防范 网 站 钓鱼 等 金融 
诈骗 。 

(3) 手机 短信 、 动 态 令 牌 等 安全 产品 也 一 定 程度 上 保障 了 金融 交易 的 安全 ， 并 得 到 广 
泛 应 用 。 

(4) 人 民 银 行 还 针对 RSA1024 算法 破解 、 数 据 同步 机 制 促 发 系统 停机 ， 云 灾 备 安全 
风险 、 支 付 空间 的 漏洞 、 银 行 卡 交 易 信 息 截 取 等 方面 的 问题 开展 了 研究 。 


4. 已 形成 移动 支付 、 信 息 安 全 等 级 保护 等 方面 的 系列 标准 


自 2011 年 以 来 人 民 银 行 积极 研究 规划 移动 支付 标准 体系 ， 目 前 已 形成 涵盖 应 用 基 
础 、 安 全 保障 、 设 备 、 支 付 应 用 、 联 网 通用 5 大 类 35 项 标准 在 内 的 中 国 金融 移动 支付 标 
准 规范 体系 。 

信息 安全 等 级 保护 等 方面 的 系列 标准 也 逐步 完善 。 依 据 《 信 息 安全 等 级 保护 管理 办 
法 》， 人 民 银 行 出 台 了 《中 国人 民 银 行 关于 银行 业 金 融 机 构 信息 系统 安全 等 级 保护 等 级 的 
指导 意见 》， 并 于 2012 年 发 布 了 《金融 行业 信息 系统 信息 安全 等 级 保护 实施 指引 》《 金 
融 行 业 信息 安全 等 级 保护 测评 服务 安全 指引 》《 人 金融 行业 信息 系统 信息 安全 等 级 保护 测评 
指南 》3 项 行业 标准 ， 在 采用 《信息 系统 信息 安全 等 级 保护 基本 要 求 》 的 590 项 基本 要 求 
的 基础 上 ， 补 充 细 化 基本 要 求 项 193 项 ， 新 增 行业 特色 要 求 项 269 项 ， 为 金融 行业 开展 关 
键 信息 系统 信息 安全 等 级 保护 实施 工作 葛 定 了 坚实 基础 。 

5. 信息 安全 等 级 保护 工作 稳步 推进 

截至 2012 年 年 底 ， 全 国 性 银行 业 金 融 机 构 完 成 了 880 个 二 级 以 上 信息 系统 的 定 级 评 
审 。2013 年 ， 人 民 银 行 发 布 了 《中 国人 民 银 行 办 公 厅 关于 开展 重要 信息 系统 信息 安全 等 级 
保护 测评 整改 工作 的 通知 》， 启 动 了 全 行 范围 的 重要 信息 系统 等 级 保护 测评 整改 工作 。 测 
评 范围 为 反 洗 钱 中 心 、 征 信 中 心 、 清 算 总 中 心 和 金融 信息 中 心 的 48 个 重要 信息 系统 。 
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据 测评 机 构 统计 ， 通 过 测评 ， 各 单位 共 发 现 了 4284 项 安全 问题 ， 整 改 完成 了 3451 
项 。 通 过 测评 整改 ， 各 单位 普遍 增强 了 信息 安全 意识 和 工作 技能 ， 信 息 系 统 安全 管理 水 
平 、 安 全 防护 能 力 得 到 显著 提高 ， 人 民 银 行 重 要 信息 系统 的 测评 符合 率 平均 值 达到 了 90% 
区 


8.4.2 ”我 国 金融 信息 安全 的 制约 因素 
1. 金融 信息 技术 对 外 依赖 程度 较 高 


目前 国内 金融 业 使 用 的 信息 系统 和 网 络 设备 ， 大 部 分 来 自 国 外 ， 包 括 数据 存储 器 、 操 
作 系 统 、 数 据 库 、 芯 片 等 。 由 于 不 掌握 核心 技术 ， 很 难 判断 设备 是 否 存 在 开发 中 有 意 预 贸 
或 无 意 朴 忽 造成 软件 陷阱 等 安全 漏洞 。 另 外 ， 新 技术 在 带 来 金融 业务 增长 的 同时 本 身 也 会 
带 来 风险 。 在 特殊 情况 下 ， 安 全 漏洞 可 能 被 利用 实施 入 侵 ， 修 改 或 破坏 设备 程序 ， 或 从 设 
备 中 窃取 机 密 数据 和 信息 。 


2. 金融 信息 安全 保护 的 法 律 环境 缺失 


我 国 现代 征 信 体 系 建设 起 步 较 晚 ， 征 信 管 理 立 法 更 加 滞后 。 征 信 是 一 项 法 律 性 很 强 的 
工作 ， 由 于 对 企业 和 个 人 信息 主体 征 信 涉 及 公民 隐私 和 企业 商业 秘密 等 问题 ， 而 我 国 现 有 
的 法 律 体系 中 尚 无 一 项 法 律 和 法 规 为 征 信 活 动 提供 直接 依据 ， 导 致 征 信 机 构 在 信息 采集 、 
信息 披露 等 关键 环节 上 无 法 可 依 ， 征 信 主 体 权益 难以 保障 ， 严 重 影响 了 我 国 征 信 体 系 的 健 
康 发 展 。 

近年 来 ， 黑 客 把 攻击 银行 、 证 券 等 金融 机 构 信息 作为 网 络 违法 犯罪 活动 的 重要 目标 。 
基于 开放 性 网 络 的 金融 服务 一 旦 发 生 风 险 ， 可 能 造成 客户 重要 数据 丢失 ， 使 客户 资金 处 于 
危险 状态 。 而 我 国 在 金融 信息 安全 保护 立法 方面 的 缺陷 ， 导 致 监管 手段 和 措施 乏力 ， 金 融 
信息 的 安全 与 保护 面临 巨大 的 风险 和 挑战 。 


3. 金融 业 信 息 安 全 联动 机 制 有 待 加 强 


金融 信息 的 安全 与 保护 是 一 个 综合 性 和 复杂 性 的 社会 工程 ， 需 要 多 个 职能 部 门 加 强 分 
工 协作 ， 密 切 沟通 配合 。 而 我 国 在 金融 信息 保护 工作 中 ， 多 方 联动 、 上 下 齐 抓 的 工作 机 制 
没有 形成 ， 应 急 管 理 体系 和 职能 划分 制度 不 完善 ， 也 未 能 建立 有 效 的 评估 和 审议 工作 制 
度 ， 金 融 信息 安 全 防护 工作 处 于 金融 机 构 独 立 管理 和 维护 状态 ， 势 单 力 薄 ， 一 旦 发 生 重大 
应 急性 信息 安全 事件 ， 将 对 我 国 金融 业 整 体 稳健 运行 造成 很 大 的 冲击 和 影响 。 


4. 来 自 外 部 的 风险 威胁 增多 


除开 放 式 网 络 操作 性 风险 外 ， 外 部 金融 力量 入 境 也 给 我 国 金融 信息 安全 造成 了 潜在 隐 
患 ， 如 : 世界 四 大 会 计 师 事务 所 已 控制 并 试图 垄断 中 国 的 会 计 审计 业 ; ”三 大 评级 机 构 在 
中 国 积极 拓展 业务 ; 国际 投行 对 中 资 企业 境 外 上 市 的 咨询 承销 已 形成 垄断 ; 国际 战略 投 
资 者 的 引进 使 中 资金 融 机 构 的 投资 经 营 活动 等 信息 呈现 “客观 外 泄 ”。 因 此 ， 金 融 企业 加 
强 自身 信息 安全 保障 工作 ， 建 立 完 善 的 安全 机 制 来 抵御 外 来 和 内 在 的 信息 安全 威胁 就 显得 
尤为 必要 和 紧迫 。 
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(OE 关 国 金融 信息 安全 保障 机 制 


现代 金融 业 作为 知识 密集 型 产业 ， 在 目标 规划 、 研 发 建设 、 运 行 维护 、 监 控 或 退出 与 
信息 技术 相关 的 产品 、 服 务 传递 渠道 等 方面 日 益 体现 出 以 知识 和 信息 技术 为 基础 的 特征 。 
金融 作为 现代 经 济 的 核心 ， 关 系 着 国家 安全 、 经 济 命脉 和 社会 稳定 ， 而 金融 信息 安全 则 成 
为 影响 政治 、 经 济 等 国家 战略 安全 的 重要 因素 。 

20 世纪 中 期 以 来 ， 美 国 在 注重 信息 优势 发 展 经 济 的 同时 ， 将 信息 安全 纳入 国家 安全 
战略 范畴 ， 建 立 起 一 整套 较为 完善 的 信息 安全 保护 和 防范 机 制 ， 美 国 在 金融 信息 安全 保障 
机 制 方面 的 成 功 做 法 值得 我 国学 习 借鉴 。 


8.5.1 美国 金融 信息 安全 保障 机 制 的 特点 


一 直 以 来 ， 美 国 把 信息 安全 问题 列 为 国家 安全 战略 的 最 重要 组 成 部 分 ， 在 推进 信息 技 
术 与 金融 业务 融合 发 展 的 同时 ， 对 关系 金融 业 命脉 的 数据 信息 在 经 济 金融 全 球 化 趋势 下 提 
出 了 更 高 的 风险 管理 要 求 ， 建 立 的 信息 保障 机 制 从 技术 基础 、 信 息 运营 系统 、 管 理 模式 等 
方面 都 体现 出 了 先进 的 理念 和 特点 。 


1. 项 级 的 信息 安全 技术 基础 


美国 拥有 全 球 项 级 的 IT 企业 和 人 才 ，IBM、EMC、ORACLE 等 公司 作为 全 球 数据 
存储 系统 的 垄断 赛 头 ， 其 高 端的 数据 存储 技术 为 金融 业 的 信息 安全 葛 定 了 坚实 基础 ， 为 以 
金融 行业 为 首 的 众多 行业 提供 优秀 的 数据 存储 服务 和 IT 解决 方案 ， 客 户 群 遍及 全 球 。 

美国 IT 软 硬 件 公司 与 科技 专家 高 度 重视 技术 革新 对 金融 信息 安全 的 保障 作用 ， 不 懈 
追求 新 技术 ， 目 前 已 拥有 3EB 容量 的 磁 存 储 技术 、 存 储 速度 更 快 的 热 储 技术 等 高 端 
技术 。 

美国 银行 更 是 不 惜 花费 成 本 更 新 系统 的 硬件 和 软件 ， 为 金融 数据 信息 打造 了 一 个 安全 
的 “避风 港 ”。 

2. 完善 的 金融 信息 系统 

美国 金融 业 在 利用 信息 技术 推动 管理 和 业务 创新 的 同时 ， 注 重 加 强 信息 系统 安全 防 
护 ， 构 筑 能 适应 庞大 、 集 中 的 金融 数据 处 理 与 传输 要 求 的 安全 屏障 。 

美国 的 金融 业内 部 、 金 融 业 之 间 、 金 融 业 与 客户 三 层 信息 系统 已 相当 完善 ， 数 据 备 
份 、 加 密 技术 、 访 问 控制 、 入 侵 检 测 、 漏 洞 扫描 、 防 病毒 等 安全 保障 措施 到 位 。 每 个 信息 
系统 都 建立 了 标准 化 的 操作 规则 ， 既 提高 了 金融 机 构 的 管理 效率 和 服务 质量 ， 也 最 大 限度 
地 避免 了 联网 带 来 的 病毒 感染 、 黑 客 攻击 、 身 份 假 冒 等 安全 威胁 。 


3. 实现 了 动态 和 持续 化 管理 


信息 技术 的 持续 更 新 决定 了 对 风险 的 识别 、 管 理 和 控制 需要 动态 及 时 跟 进 ， 这 也 是 实 
现 信息 完整 性 、 保 密 性 及 可 用 性 的 必然 要 求 。 
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美国 的 金融 信息 安全 保障 体制 已 形成 动态 管理 模式 ， 如 著名 的 美国 RSA 信息 安全 公 
司 就 提供 专门 的 外 部 安全 服务 ， 帮 助 金融 机 构 应 对 各 种 安全 威胁 ， 既 包括 日 常安 全 监测 维 
护 ， 也 包括 在 发 生 欺诈 、 钓 鱼 攻击 、 僵 尸 网 络 等 突 发 安全 事故 时 提供 实时 应 急 保 护 ， 将 威 
胁 快 速 阻止 并 将 危害 降 到 最 低 ， 并 配合 相关 部 门 开 展 对 入 侵 者 的 事后 追踪 。 


8.5.2 ”美国 金融 信息 安全 保障 机 制 的 主要 做 法 
1. 完善 金融 信息 安全 政策 立法 


美国 政府 采取 多 角度 形式 构筑 金融 信息 安全 的 政策 立法 。 

1966 年 《信息 自由 法 》 将 金融 信息 列 为 需要 保护 的 信息 之 一 。1996 年 《经 济 间谍 法 
案 》《 国 家 信息 基础 设施 保护 法 案 》 等 规定 未 经 授权 、 基 于 商业 目的 进入 在 线 的 计算 机 窃 
取 人 金融 信息 可 判 监禁 最 高 为 20 年 的 重罪 。1997 年 颁布 的 《关于 信息 安全 技术 及 产品 对 
外 国政 府 开放 的 管理 规定 》 在 出 口 产品 方面 对 加 密 软 件 产 品 、 高 端 技术 产品 严 加 管制 。 美 
国 还 运用 行政 权力 保障 金融 信息 安全 ， 如 《克林顿 政府 对 关键 基础 设施 保护 的 政策 》， 布 
什 在 任期 内 签署 《信息 时 代 的 关键 基础 设施 保护 》， 并 督促 国会 通过 《联邦 信息 安全 管理 
法 案 》 等 ， 这 些 都 是 为 了 保护 通信 、 金 融 、 能 源 等 基础 设施 信息 的 安全 。 

2. 推行 信息 安全 产品 评估 策略 


美国 政府 将 信息 产品 的 安全 性 和 可 信 度 作为 信息 基础 建设 的 重要 组 成 部 分 ， 早 在 20 
世纪 70 年 代 就 开展 了 信息 产品 安全 性 评估 的 研究 ，20 世纪 90 年 代 末 设立 了 专门 从 事 信 
息 产品 安全 评估 的 机 构 一 一 国家 信息 保障 同盟 ( NIAP)。 

NIAP 由 国家 信息 与 技术 研究 所 以 及 国家 安全 局 的 专业 技术 和 管理 人 员 组 成 ， 代 表 国 
家 指导 和 监督 信息 产品 的 安全 评估 工作 。 其 下 设 的 计算 机 安全 事业 部 负责 信息 产品 脆弱 性 
研究 与 信息 安全 技术 开发 ， 制 定 有 关 信息 技术 标准 、 制 订 测试 与 评估 方法 及 实施 方案 。 美 
国 对 信息 安全 产品 的 评估 策略 实际 上 是 将 信息 安全 技术 和 产品 的 发 展 置 于 政府 的 完全 监督 
和 控制 之 下 。 

3. 立体 和 层次 化 的 金融 信息 安全 管理 体系 


在 国家 层面 ， 美 国 设立 了 行政 实体 “总 统 关键 基础 设施 保护 办 公 室 ” 作 为 联邦 基础 设 
施 安 全 (包括 金融 信息 安全 ) 保 护 的 最 高 管理 协调 机 构 ， 通 过 定期 集会 ， 加 强 关 键 基础 设施 
安全 保护 中 公共 和 私营 部 门 间 的 合作 ， 并 在 必要 的 时 候 向 总 统 提交 报告 。 

在 部 委 层面 ， 除 涉及 国防 、 外 事 、 情 报 、 执 法 等 关键 领域 的 保护 职能 必须 主要 由 联邦 
政府 执行 外 ， 针 对 其 余 每 一 个 信息 基础 设施 部 门 ， 指 定 一 个 唯一 的 联邦 部 局 作为 领导 机 构 
负责 协调 美国 政府 在 该 领域 内 的 活动 。 

在 机 构 层 面 ， 各 联邦 机 构 自 己 负责 机 构 内 的 信息 安全 保障 工作 ， 将 信息 安全 管理 纳入 
机 构 战略 和 运营 规划 ， 并 定期 向 机 构 主 管 ， 众 议院 、 参 议院 、 国 会 授权 的 对 口 委员 会 以 及 
审计 总 署 提 交 报 告 ， 汇 报 机 构 信 息 安 全 策略 实施 情况 。 
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4. 统筹 相关 职能 部 门 并 明确 职责 


金融 信息 安全 工作 牵涉 部 门 多 ， 美 国 统筹 规划 和 明确 职能 部 门 对 信息 安全 工作 的 职 
责 ， 确 保 金 融 信息 安全 管理 高 效 统 一 。 

财政 部 负责 银行 与 金融 信息 安全 的 统筹 协调 ;科技 政策 办 公 室 负责 协调 安全 保护 方面 
的 科研 工作 ; 管理 和 预算 办 公 室 负责 监督 联邦 政府 的 计算 机 安全 制度 在 整个 政府 部 门 的 实 
施 ， 并 每 年 对 信息 安全 程序 和 实践 进行 有 效 性 测试 及 评估 ; 中 央 情 报 局 负责 评估 其 他 国家 
对 美国 网 络 和 信息 系统 的 威胁 ; ”司法 部 和 联邦 调查 局 则 负责 对 网 络 和 信息 犯罪 的 调查 和 
起 诉 工作 。 


(0) 和 我国 金 融 信息 安全 建设 


8.6.1 完善 顶层 设计 ， 尽 快 构建 适应 我 国 金融 发 展 需要 的 金融 信 
息 安 全 保障 体系 


我 国 金融 行业 被 美国 高 技术 公司 全 面 渗透 ， 部 分 产品 或 服务 呈现 垄断 态势 。 思 科 公司 
自 1997 年 进入 中 国 就 全 面 参 与 金融 核心 骨干 网 建设 ， 其 网 络 设备 在 金融 行业 广泛 使 用 。 
思科 在 华 金融 业务 广泛 ， 客 户 包 括 工商 银行 、 农 业 银 行 、 中 国 银行 、 地 方 银行 等 ， 占 据 3 
流 服 务 提供 商 位 置 。IBM 面向 工商 银行 、 建 设 银行 、 农 业 银行 ， 以 及 一 些 地 方 银行 等 全 面 
提供 金融 业务 系统 的 建设 、 规 划 、 咨 询 、 方 案 、 产 品 、 运 维 等 ， 占 据 市 场 核心 位 置 。 微 软 
的 服务 器 和 终端 操作 系统 占据 了 化 断 地 位 。 在 当前 的 网 络 安全 环境 下 ， 国 家 金融 在 网 络 空 
间 中 的 安全 风险 不 可 忽视 ， 应 尽快 研究 制定 国家 金融 行业 信息 安全 的 防护 体系 。 

《2006 一 2020 年 国家 信息 化 发 展 战略 》 明 确 提出 ，“ 要 把 信息 化 作为 覆盖 现代 化 建 
设 全 局 的 战略 举措 ”。“ 十 二 五 ”期 间 ， 我 国 的 金融 业 将 进一步 强化 “科技 保障 业务 、 科 
技 引领 业务 ”的 能 力 ， 努 力 赶 超 发 达 国 家 金融 信息 安全 体系 水 平 ， 达 到 “使 用 面 广 ， 设 
备 先进 ; 功能 齐全 ， 服 务 完善 ， 自 动 化 程度 高 ， 安 全 保密 性 强 ”。 

构建 金融 信息 安全 体系 的 总 体 目 标 是 物理 安全 、 网 络 安全 、 数 据 安全 、 信 息 内 容 安 
全 、 信 息 基础 设备 安全 与 公共 信息 安全 的 总 和 ， 最 终 目 标 是 保障 业务 持续 ， 促 进 业 务 发 
展 ， 保 障 信息 的 机 密 性 、 完 整 性 和 可 用 性 ， 以 及 信息 系统 主体 对 于 信息 资源 的 控制 。 金 融 
信息 安全 体系 的 构建 必须 符合 国家 和 金融 管理 部 门 有 关 信息 安全 的 政策 、 标 准 、 规 范 、 指 
南 和 细则 。 金 融 信息 安全 体系 主要 包括 以 下 4 个 领域 : 信息 安全 策略 、 信 息 安 全 管理 、 信 
息 安 全 运作 和 信息 安全 技术 。 


8.6.2 ”尽快 制定 我 国 金融 行业 国产 信息 技术 产品 和 服务 替代 战略 


我 国 金融 行业 信息 化 建设 呈现 对 国外 厂商 依赖 进一步 加 深 的 倾向 。 鉴 于 业务 连续 性 和 
高 可 靠 性 等 要 求 ， 我 国 金融 业 信息 系统 和 业务 系统 大 量 采 用 了 国外 厂商 生产 的 设备 和 系 
统 ， 如 服务 器 、 小 型 机 、 大 型 机 、 存 储 设备 、 网 络 设备 、 芯 片 以 及 操作 系统 、 数 据 库 、 密 
码 算法 、 安 全 通信 协议 等 ， 覆 盖 了 金融 核心 业务 系统 运行 和 服务 的 各 个 环节 ， 成 为 不 可 蔡 
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代 的 系统 ， 而 且 随 着 信息 系统 不 断 升级 ， 越 来 越 依赖 于 国外 厂商 ， 这 种 趋势 正在 逐步 加 
深 。 因 此 ， 十 分 迫切 需要 金融 行业 信息 技术 产品 和 服务 的 国产 化 ， 以 便 为 我 国 金融 信息 安 
全 体系 建设 提供 可 靠 的 技术 保障 。 


8.6.3 尽快 制定 金融 行业 自主 可 控 战 略 实施 步骤 ， 推 进 自主 可 
控 国 家 战略 


我 国 金融 行业 信息 安全 战略 难以 根本 上 保障 ， 吸 须 完善 自主 可 控 的 国家 信息 安全 体系 
建设 。 我国 网 络 系统 大 多 依托 美国 公司 的 技术 、 装 备 和 服务 ， 它 们 对 于 监控 者 来 说 几乎 是 
透明 的 ， 更 不 用 说 其 自身 具有 的 “后 门 ”。 目 前 ， 常 规 安全 防护 措施 已 经 无 济 于 事 ， 必 须 
从 根本 上 改变 这 种 局 面 ， 调 整 国家 战略 进行 信息 安全 保障 。 从 “棱镜 门 ”事件 折射 出 ， 我 
国 亟 须 完善 自主 可 控 的 国家 信息 安全 体系 建设 ， 紧 跟 国家 信息 安全 等 级 保护 制度 ， 强 化 基 
础 网 络 和 重要 信息 系统 的 等 级 化 保护 和 监督 管理 ， 落 实 等 级 保护 相关 措施 。 同 时 ， 鼓 励 和 
扶持 民族 核心 技术 及 产品 创新 ， 运 用 具有 自主 知识 产权 的 产品 和 技术 ， 保 障 国 家 基础 网 络 
和 重要 信息 系统 安全 ， 实 现 真 正 的 自主 可 控 。 


8.6.4 应 用 大 数据 进行 信息 安全 分 析 


应 用 大 数据 平台 进行 信息 安全 分 析 ， 通 过 对 安全 日 志 、 应 用 日 志 、 业 务 数据 、 外 部 数 
据 进行 风险 关联 分 析 ， 及 时 发 现 来 自 外 部 的 攻击 行为 、 内 部 违规 行为 ， 通 过 外 部 泄露 数据 
与 银行 客户 、 交 易 数 据 的 分 析 ， 主 动 发 现 针 对 客户 的 攻击 行为 、 识 别 客户 的 潜在 风险 ， 对 
高 危 风险 进行 预警 ， 通 过 对 海量 历史 数据 挖掘 分 析 及 智能 学 习 ， 还 原 客户 、 用 户 历 史 操 作 
行为 ， 获 取 风 险 模型 的 新 型 特征 ， 使 大 数据 助力 于 信息 安全 。 

首先 ， 可 建设 案件 分 析 实 验 室 ， 通 过 对 已 发 生 案件 数据 收集 ， 在 大 数据 平台 的 实验 数据 
环境 下 进行 模型 验证 与 训练 ， 寻 找 案件 的 典型 行为 特征 。 系 统 通过 一 段 时 间 在 客户 登录 、 操 
作 、 交 易 过程 中 对 该 特征 行为 规则 的 分 析 跟踪 优化 ， 将 成 熟 的 风险 模型 运用 在 监控 系统 上 。 

其 次 ， 可 建设 基于 大 数据 的 安全 威胁 情报 监控 系统 ， 实 现 对 安全 事件 的 有 效 预 测 和 自 
动 化 实时 控制 ， 及 时 发 现 安全 威胁 、 识 别 潜在 安全 隐患 ， 把 握 安 全 风险 态势 ， 由 被 动 的 安 
全 防御 向 主动 的 事前 安全 防御 转变 。 

在 新 形势 下 ， 搭 建 自身 的 安全 防护 体系 、 设 计 安 全 规划 ， 需 要 将 终端 、 云 端 、 网 端 三 
位 一 体 的 综合 协同 联防 的 安全 防御 思路 融入 其 中 ， 充 分 利用 大 数据 进行 威胁 情报 的 数据 集 
中 与 深度 挖掘 ， 才 能 有 效应 对 大 数据 时 代 的 各 种 新 型 威胁 ， 保 护 金融 业 的 重要 信息 资产 。 


本 章 总 结 


e@ ”金融 信息 安全 是 指 利用 信息 或 者 金融 数据 信息 ， 对 金融 领域 实施 的 各 类 安全 措施 
和 应 对 手段 。 金 融 信息 安全 包括 数据 安全 、 运 行 安全 、 软 件 安全 和 物理 安全 。 

e ”金融 信息 安全 与 一 般 的 信息 安全 相 比 有 较 多 的 相似 性 ， 具 有 保密 性 、 完 整 性 、 可 
用 性 、 真 实 性 、 可 追溯 性 、 可 靠 性 保护 以 及 连续 性 等 特点 。 
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4. 


金融 信息 安全 是 国家 安全 中 重要 的 根本 内 容 之 一 ， 金 融 掌 握 着 国家 的 经 济 命脉 ， 
没有 良好 的 金融 安全 保障 ， 就 会 危及 国家 的 安全 稳定 。 另 外 金融 信息 安全 更 是 国 
家 发 展 战略 的 重要 基石 ， 金 融 数据 信息 的 破坏 和 窃取 往往 会 对 国家 、 社 会 。 个 人 


产生 巨大 的 损失 。 


大 数据 在 应 用 我 国信 息 安 全 时 也 存在 一 定 的 隐患 : QD 大 数据 的 应 用 会 侵犯 客户 的 
个 人 隐私 。@ 数 据 监 听 会 威胁 国家 金融 安全 。@@ 虚 假 数据 会 导致 金融 市 场 异常 敏 
感 。 外 国内 相关 法 律 的 缺失 存在 风险 。@@ 人 金融 信息 安全 技术 的 发 展 跟 不 上 层 出 不 
穷 的 互联 网 应 用 发 展 速度 。@ 网 络 安全 防 控 是 互联 网 金融 信息 安全 防范 的 难点 。 
大 数据 金融 信息 安全 风险 主要 包括 法 律 风 险 、 物 理 环 境 风险 、 技 术 风险 、 信 息 泄 
露 风险 等 ， 具 有 扩散 性 强 、 影 响 面 广 以 及 风险 评估 难 等 特点 。 

我 国 逐 渐 加 大 了 对 金融 信息 安全 的 重视 ， 已 经 形成 以 “一 行 三 会 ”为 基础 的 安全 
保障 机 制 ， 相 关 的 信息 技术 也 不 断 地 进步 。 但 我 国 金融 信息 技术 的 对 外 依赖 程度 
依旧 较 高 、 缺 乏 良好 的 法 律 环境 、 金 融 业 信息 安全 联动 机 制 不 完善 以 及 外 部 风险 


威胁 增 大 ， 因 


此 ， 金 融 信息 安全 依旧 任 重 而 道 远 。 


. 国际 上 没有 对 信息 安全 的 一 臻 定义， 请问 你 是 如 何 理解 信息 安全 的 ? 


简 述 金融 信息 安全 的 定义 及 属性 特征 。 

你 觉得 金融 信息 安全 重要 吗 ? 为 什么 ? 

众所周知 ， 大 数据 给 金融 信息 安全 带 来 了 机 遇 的 同时 ， 也 带 来 了 巨大 风险 ， 谈 谈 你 

认为 如 何 才 能 高 效率 使 用 大 数据 。 
5. 你 认为 我 国 金融 信息 安全 保护 在 现 阶段 有 哪些 制约 因素 ? 如 何 打 破 这 些 制 约 因素 ? 
6. 谈 谈 如 何 学 习 美国 的 金融 信息 安全 保障 机 制 ， 来 构建 中 国 特色 的 金融 信息 安全 体系 。 
7. 叙述 你 感 兴趣 的 一 个 金融 信息 安全 事件 或 事故 ， 并 说 说 你 从 中 得 到 了 什么 启示 。 
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